uzun zamandır kafamda olan bu yönelim için gerekli ilk adımı attım. dün istifamı verdim. kendim inşaat mühendisiyim. bir daha da inşaat işleri ile uğraşmayacağım.
8-9 ay kadar bu alanda kurslarla projelerle vs kendimi geliştirmek istiyorum.
bu alanda çalışmış ya da çalışan arkadaşların tavsiyelerine açığım.
kafamda öğrenilmesi gerekenler olarak şunlar var.
sql hadoop r pandas linux cassandra hbase apache ambari cloudera python
gerekli zaman ve naktim de var. şurada çok güzel kurs var şuradan başlarsan iyi olur, şu dile de bak bilmen lazım derseniz. o da güzel olur.
teşekkür ederim kolaylıklar dilerim.
ben de çömezim bu konuda, kendi karşılaştıklarımdan hareketle bi şeyler yazmak istedim. matematik ve istatistik kısmını halletmeniz gerekiyor öncelikle. çünkü veri biliminin temeli bunlar. python'u bir yazılımcı kadar hatmetmeniz gerekmiyor en azından ilk aşamada. data için kullanılan kısımları temel düzeyde, takıldığınız yerde stackoverflow yardımınıza koşar zaten. kursa para vermek kerizlik gibi geldiğinden kendi başıma bi şeyler öğreneyim diye biraz vakit harcadım önce. ama çok kayboldum. baktım olmayacak bi veri bilimi kursuna kaydoldum. çok para verdim keriz gibi evet :') ama iyi ki de kaydolmuşum diyorum şimdi, çünkü kendi başıma bunları öğrenemezmişim. yol gösteren biri olması iyi oldu benim açımdan.
veri biliminin asıl bağlandığı yer istatistik yani sırf kodlara yönelirsen sadece işin mavi yakası olursun. veri setine yorum yapamazsın. yani istatistik kasman lazım.
eğer dışarıdan öğrenmeyi planlıyorsan yurtdışı üniversitelerin ders programlarına bak ve mümkünse syllabus'ları incele. neden bu dersi koymuşlar diye düşün zaten göreceksin ki python falan en az işlenen konu.
bütün o kodlama vs bellirli bir teorik eğitimin üzerine koyuluyor.
birde tabi mutlaka case studylere bak
data mining with r learning with case studies gibi kitapları araştır
bir de çok makale okuman lazım ki uygulamaları öğrenebilesin.
her zaman için en iyi metod pratik öğrenmedir o sebeple kendine bir app hedefle. mesela twitter'da belli kelimeleri like eden ve kelimelere göre response yazan bir bot hesabı kurmaya çalış.
10 tane falan holding gordum sanirim, temelde data temiz sekilde zaten elinde var.
Datayi ben gonderiyorum bugun bu kadar satis olmus diye.
Bunu alip kullaniciya gosteriyorsun is bundan ibaret.
Yani cok zor bir is yapmiyorlar bildigin kullanici gibiler, kod yazan ilginc seyler yapan kisi sayisi belki sektorun milyonda biri falandir.
Sadece ise girsen gerisi gelir, ise girmek icin altyapin oldugunu kanitlaman gerekiyor.
Ama o altyapiyi kullanmayacaksin.
Zaten bu departmanlar kurulmadan once de bu is yapiliyordu raporlari ben yazilimci olarak cikiyordum, sadece adini havali yaptilar.
başlangıç olarak python ve sql öğren. python öğren derken tabi detaylı bir öğrenmekten bahsetmiyorum object oriented kısmına falan fazla girmene gerek yok. temelini öğrendikten sonra python'da numpy, pandas, veri görselleştirme, modelleme vs. kısımlarına da bak kendin. udemy'den btk akademi'den falan kurslarla sql, python ve veri analizi, bilimi temellerini hallet önce. onu hallettikten sonra bir kursa girmek daha mantıklı bence, direkt en baştan kursa girsen fazla uzak kalabilirsin mevzuya hızlı gidiliyor gibi gelebilir sana zorlanılabilir ve soğuyup kaçılabilir o yüzden. dediğim şekilde ilerlersen yakınlaşmış olursun ve öğrendiklerin pekişmiş olur hem de farklı yaklaşımlar görmüş olursun bence daha sağlıklı böylesi. kurs olarak itü'nün bir sertifika programı vardı mesela o olabilir ya da veri bilimi okulu'nun kurs programları var bunlar ücretli. bootcamp düzenleyen firmalar var mesela patika'nın veri bilimi bootcamplerini takip edip başvurabilirsin burda seçilmesi mesele ama seçilirsen ücretsiz. udemy, youtube falan bir yere kadar bu tarz kurslar sana hem bir network sağlar hem de daha sağlıklı bir vizyon oluşturur bence gerekli. dimdirekt istatistiğe girersen de soğursun bence sıkıcı ve keyifsiz çünkü. zaten bu noktaya kadar belirli istatistik bilgileri alıcaksın istemesen de daha derin girmek istersen bu noktadan sonra girmeni tavsiye ederim.
bundan sonra zaten kendi fikirlerin oluşmuş olur nelerle uğraşıcağına dair. big data kısmıyla benim de çok bilgim yok o işlere giremedim hala ama onun dışında deep learning, etl toolları ve bi toollarıyla (power bi, tableau başta) ilgilenmen yararlı olur. nosql mongo ve diğer dediklerin de bu aşamada bakılabilir.
bir de bir konunun farklı toollarının, dillerinin vs. hepsiyle üst üste ilgilenmen çok yanlış olur bence o konuda uyarmak istedim. yani BI toollarına bakıcaksan birini seç ona bak diğerlerine bakmakla uğraşma. ya da dil olarak python bakıcaksan r'a bakma bunlar birbirinin türevleri çünkü. daha sonra ihtiyaç duyarsan gene bakarsın ama ilk başta hepsine bakmak gereksiz zaman kaybı olur.