2) Rusya, Çin, Fransa, Japonya ya da bir başka dünya ülkesi bu kadar verinin Amerika’da bir merkezde toplanmasından rahatsız değil mi? Diğer ülkeler de aynı nicelikte veriye sahipler mi?
3) Bilinen amaçlar(istihbarat, marketing, seçim manipülasyonları vb.) dışında ne gibi çalışmalar, deneyler, amaçlar için kullanılıyor olabilir?
4) Big Data’nın güvenliği ne şekilde sağlanıyor? Yedekleniyor olma ihtimali ne ölçüde gerçekle ilintili?
5) Fazla sci-fiction gelse de büyük bir savaşta bir ülkenin otonom sistemlerine, köprülerine, haberleşme araçlarına saldırılması gibi saldırılabilecek bir konumda mı?
1- big data dediginiz sey nedir? dunyadaki tum verilerin toplandigi yere big data denmez :) bi kavram karistirmasi var sanirim.
vikipedi aciklamasiyla: Büyük veri; toplumsal medya paylaşımları, ağ günlükleri ,bloglar, fotoğraf, video, log dosyaları gibi değişik kaynaklardan toparlanan tüm verinin, anlamlı ve işlenebilir biçime dönüştürülmüş biçimine denir.
2- onlar da topluyor. cin'de facebook filan yasakli. her uygulamanin cin'li versiyonunu kullaniyorlar.
3- trump - secim - rusya seklinde aratabilirsiniz. xxx analytics rezaleti de vardi, zukenberg yargilandi hatta bu sebeple. sirketin adini unuttum.
4- sirketler veri tabanlarini mumkun oldugunca guvenli hale getirirler. sizma her zaman mumkun.
5- kim bu konumda mi?
edit: yuzeysel & ortalama google bilgisi :) insanlari tanimadan boyle sozler soylemek degisik. kolay gelsin, umarim aradigin cevaplari bulursun.
@fakyoras Hiçbir şekilde bir kavram karışıklığı yok. Big Data dijital anlamda soyut. Silikon vadisi ve türevi yerlerde ciddi anlamda üzerinde çalışılan, belli merkezlerde depolanan, bilfiil mekansal karşılığı olan ve tek bir kuruma ait olmayan verilerin bütünü. Nicelik olarak en büyük ölçekli veri Amerika’da. Diğer ülkelerin verileri onunkinin yanında işlevsel anlamda oldukça komik.
Siz çok yüzeysel ve ortalama google bilgisiyle olayı okuyorsunuz ya da bu konuyla ilgili yeterli bilgiye sahip değilsiniz.
Facebook ve bağlı şirketleri(Whatsapp, Instagram) Twitter, Google ve daha birçok şirketin bu bilgileri donanımsal olarak depoladığı yerlerin tümü ya da bir kısmı için mekansal bir tanım da “Big Data”yı içine alıyor.
3) google aramalarından grip salgını ve etki alanını doğru bir şekilde hesapladıklarına dair birşeyler izlemiştim, eğitimli kitlenin mesai saatlarinde dizi izlemesinden falan ekonomik durgunluk kriz gibi durumlar arasında bağlantı kurduklarını duymuştum.
4)en basitleri bile genelde 2 farklı kıta 3 farklı merkez de yedekli oluyor
@fakyoras Cambridge Analytica olayında kabaca 50 milyon Facebook hesabı kullanıldı. Big Data için 50 milyon kişi komik bir sayı bile değil. Bu kullanım Big Data’nın gerçek işlevselliği ve asıl gücünü anlatmakta da yetersiz ve sönük.
1- hayır. çok merkezde biriktiği, birikmeye de devam ettiği için yok edilemez.
2- hayır, herkes kendi datalarını biriktiriyor.
3- çok çeşitli.
4- siber güvenliğin bilinen yöntemleri ile.
5- evet. çok daha fazlası da yapılabilir.
kavramların birbirine girdiğine katılıyorum,
babilbaligi+1
5'e ilaveten şu anda zaten böyle, rusya'nın virusleri ameriganın nükleer santrallerini, askeri tesislerini hedef alıyor, ameriganın firüsleri rus bürokratlar/devlet tesislerini hedef alıyor (neye göre tabii ki ip to location vs. gibi şeylere göre) hatta tek bir hedefi olan hedefe ulaşıncaya kadar yayılan ama bir eylemde bulunmayan wormlar vs. de mevcut, yani hali hazırda bizler mışıl mışıl uyurken birileri birbirlerine saldırıyor, savunuyor falan. misalen şu anda usa suudi arabistana saldırıyor.
Ek kaynaklar:
threatmap.checkpoint.com
map.norsecorp.com
www.digitalattackmap.com&color=0&country=ALL&list=0&time=17819&view=map
1) "Bir şekilde" lafzı bize istemediğimiz kadar özgürlük veriyor. Madem verinin fiziksel karşılığı var, sırf Google'ın tuttuğu veriyi değil, android cihazda telefon rehberimize kadar erişebilen programların tuttuğu veriyi de yok edebilirsek... Neden olmasın?
2) Bilinen internetteki içeriği derleme konusunda Google neredeyse bir tekel ve onay mercii olduğuna göre muhtemelen aynı nicelikte veriye kimse sahip değil. (Diğer ülkelerin rahatsızlığı konusunda: Yandex'i, Vk'yı vs. bu tekeli kırmaya yönelik girişimlerden sayabiliriz.) Ek olarak Google ve benzeri şirketler yoluyla toplanan bu verinin -analytics, adsense benzeri uygulamalarla dünyanın geri kalanınının kulanımına sunulan kısmı müstesna- büyüklüğünü ve gizli kullanım alanlarını, skandallarla bir bir ifşa olmadıkça tahmin etmek de imkansız.
Ek olarak ticaret savaşı ile de anlamlanabilecek bir veri savaşı Çin ile ABD arasında uzun süredir sürüyor. Son büyük gelişme de şu: www.bloomberg.com
3) Durum böylesine açıkken gizli kalan amaçların bir önemi var mı ki? Sanki bundan sonrası bize sadece işleri komplo teorisyenliğine vardıracak bir gizemciliği getirecek. Elbette bu soru; kamuoyunun, bilgi tekelleri ve emperyalist devletler üzerinde kuracağı olası bir baskıya dönüştüğü takdirde anlam kazanacaktır.
hem kavram karmasasi var hem yok diyebilirim. bu durumu ozetle su sekilde aciklarim, dunyadaki tum kuslarin sesleri "data" dir. bu datayi mikrafon sahibi herkes toplayabilir ve bir yere saklayabilir, buna "database" denir. "big data" isleme ise bunun bir adim otesi yani bu saklanan datanin islenip, bize rasgele civilti ve gurultu gibi gelen kus seslerinin anlamini, yani ne konustuklarinin bulunmasi, kus dilinin cozulmesi, bu sonuca gore gelecek konusunda tahminde bulunulmasi dir. yani bu iste datanin bir yerde saklanmasi ve fiziksel olarak sahip olunmasi isin kucuk bir kismi, asil onemli ve zor kismi ise bu datayi isleyip anlamli bir sonuc cikaracak fiziksel teknoloji, ve algoritma sahibi olabilmektir.
ornegin twitterda datalari dunyadaki bircok noktada serverlar uzerinde saklanir, isteyen bu data yi twitterin sunmus oldugu API uzeriden alabilir. bunu evde sen de yapabilirsin, sonra bir yere saklayabilirsin. artik senin de bir "data base" in var. ama bu datayi ne yapacaksin, cok buyuk bir data ve insanlar ornegin turkiyede son zamanlarda "papaz brunson", "arda turan" ve "enflasyon" konularinda bir suru konusmuslar. bu konusulanlari bir bolumu goygoy, bir bolumu cok ciddi, bir bolumu ise konusulmus ama bir amaca hitap etmiyor. boyle yiginla data sahibi oldugunu dusun. burada asil zor kisim bu konusmalardan cesitli anlamlar cikarabilmek, degersizlerini ayristirmak, degerlilerini bir istatistik hesabina sokabilmektir. ornegi "arda turan" meselesi "papaz brunson" meselesinin halk uzerindeki etkisini istatistiksel olarak ne oranda maskelemis. ilerde boyle bir durum oldugunda bu durum ile benzerligini eslestirmek icin bir sablon (pattern) cikarilabilir mi, bu pattern cikartilir ise bunun sonuclari ne olur, tum bu olasiliklar icinde abd nin bize "fethullah guleni" iade etmesi orani ne kadar mumkun. iste eger bu datayi isleyip boyle bir olasilik hesabi yapacak teknoloji, istatistik, matamatik, algoritma kurabiliyor ise big dataya hukmediyorsundur. yoksa data ile ne yapacagini bilmedikten sonra elinde tutmanin anlami yok.
bu durumda amarikanin elini guclendiren ne peki? adamlarin datayi tutmasi bir sonuc, cunku bu data ile ne yapabileceklerini biliyorlar ve onun icin tutuyorlar. eger biz de bilseydik biz de internet uzerinde "crawler" yapip bilgiyi toplayip biz de tutabiliriz ama tutsak ne olacak ki, islemeyi bimiyoruz. bu tamamen isletme ve universite isbirligi ile olabilecek birsey.
ozetle big data olayinda dataya fiziksel olarak sahip olmak isin proseduru, en onemlisi bu data ile ne yapabildigin.
1) Big data sanki bilgisayar ve ağ teknolojileriyle ortaya çıkmış gibi bir algı var. Bilgi ve belge yönetimi tarihine biraz bakınca aslında insanlığın yazmaya başladığı andan itibaren data topladığı görülebilir. Sadece veriyi saklama ve yorumlama yöntemleri değişti. Çok yakın tarihe kadar var (2010'lar) olan kümülatif bilginin büyük çoğunluğu hala "hard copy" denen materyallerde saklanıyordu.
Şimdi dijital olarak tutuluyor. Haliyle bu depolama imkanları, veri aktarım olanakları hem yeni enformasyon üretme hızını artırdı, hem de datayı yorumlama hızını. Her ülke kendi verilerini saklar. Kimi analog olarak kimi dijital. Artık çoğu dijital. Yani TUIK'in verileri de "büyük veri", holdinglerin satış rakamları vb de. Big data deyince bilimkurgu gibi bir dünya canlanıyor insanların zihninde ama bildiğin veri işte. Sadece yeni teknolojilerle daha fazla veriye daha hızlı ulaşıp enformasyon üretmen mümkün. Haliyle bu veri düzgün arşivlenip yönetilmeyince ve korunmayınca kaybolabilir. Dünya tarihinde ne arşivler gitti.
2)Veri bir merkezde toplanmıyor. Farklı farklı kurumların kendi verileri var. Şirketler satış rakamlarını, sosyal uygulamalar kullanıcı bilgilerini vb saklıyor. Tabii ki devletler kendi topraklarındaki şirketlerin verilerinden yararlanabilir. Ya da farklı iki kurum iş birliği yapabilir. Mesela adidas facebook'la reklam işbirliği yapıp kendi marketing verileriyle facebook verilerini kullanıp reklam maliyetini düşürüp daha verimli reklamlar yapabilir. Bunun askeri boyutu da var. Haliyle birçok ülke başka ülkelerden data toplamaya çalışır. Bu geçmişte de vardı. Bugün de var. Sadece ABD özel sektörünü destekleyip elindeki teknoloji gücünü kullanarak daha iyi yapıyor bu veri toplama işini. Mevzu sadece sosyal medya değil, kredi kartı bilgilerinden tut hizmet sektöründeki şirketleriere kadar....
Veri toplamak mesele değil, bu verinin ürettiği enformasyonun kalitesi önemli. Veri toplama işini her zaman her devlet yapar. Biz de yapıyoruz.
3)Tarih boyunca ne için kullanıldıysa: Aklına gelebilecek her şey için. Ama tekrar söylüyorum. Data tek başına bir şey ifade etmez. İstersen tüm verileri topla. Doğru yorumlamadığın sürece anlamı yok.
Mesela sağlık. İngiltere organ bağışı sistemini daha verimli kullanmak için ülkedeki "organ havuzunu" tıpçı ve matematikçilerinin geliştirdiği bir algoritmayla yönetiyor. Böylece doğru organ doğru insana ulaşıyor. Bizde de aynı veri var. Bizdeki algoritma farklıdır. O yüzden bizim eşleşme oranlarımız da farklı olabilir. Belki daha iyiyizdir hatta.
Mesela ekonomi. Diyelim ki ülkenin demografik verileri ve sağlık verileri 59 yaşında ölüm oranının yüksekliğini gösteriyor. O zaman emeklilik yaşını 60'a çekip ciddi bir kamu tasarrufuna gidebilirsin. Biraz tatsız görünüyor ama böyle.
Mesela hava durumu. İklim yönetimi. Elinde ciddi bir iklim verisi olduğunu düşünelim. Ülkende ekilecek ürünleri yönetebilirsin. Ya da başka bir ülkede yaşayan çekirge popülasyonunun artış oranlarını biliyorsun. Bu veriyle çekirgenin patlama yapacağı senelerde o ülkeye tarım ilacı ihracatını artırabilirsin.
Mesela deprem tahminleri. Bir coğrafyadaki deprem sıklığını, şiddet aralığını biliyorsun. Bu sana bir sonraki depremin hangi yıllarda olacağını gösteriyor. Bu veriyle önlemler de alabilirsin, bölgede sigorta şirketlerini de zengin edebilirsin.
Mesela eğitim. Ülkende matematik konusunda zayıflık var diyelim. Bunu çözebilirsin. Ama bunun için beslenme verilerini, genetik verileri vb de analiz etmen gerekebilir.
Gördüğün gibi veriden ziyade verinin yorumlanması ve kullanılması fayda sağlıyor.
Marcus de sautoy'un belgesellerini izleyebilirsin verinin kullanımına güzel örnekleri var. Mesela yukardaki çekirge örneğini ondan aldım.
4) Basılı materyal arşivlerde korunuyor. Dijital veri de zaten bildiğin it güvenlik yöntemleriyle. Tabii ki yedekleniyor da. Yani her kurum kendi verisini kendi yöntemleriyle saklıyor aslında. Kimi daha güvenli kimi daha dikkatsiz.
5) Dediğim gibi bir merkezde toplanan bir veri söz konusu değil. Her kurumun kendi verisi var. Bu verilerin kümülatif kullanımı "big data" olarak adlandırılıyor. Her zaman birileri bu verilere ulaşmak isteyebilir. Ama net olarak bu konumda tüm veriler bulunuyor diye bir şey söz konusu olmadığı için nereyi hedef alabilirler ki? Kredi kartı şirketleri mi, nüfus idaresi mi... Veri her yerde. Her kurumun bir veri yığını var.
@anten @emrahday @hikmet iv
Verdiğiniz bilgiler çok ufuk açıcı oldu ama:
Ben yaklaşım olarak Snowdenvarî bir bakışla “insanların özel hayatlarıyla ilgili istihbarî değer taşıyabilme potansiyeli” olan verileri kastediyorum.
Gelecekle ilgili büyük hedefleri olan, ileride siyasete girecek, ülke yönetecek insanların tüm özel hayatı, gününün 24 saati de bu verilerin içinde. Sizin verdiğiniz örnekler masumane ve yapıcı örnekler.
Sanki ABD verileri insanlığı daha iyiye, daha müreffeh bir dünyaya, anlamlı bir ülküye taşımak için kullanıyor gibi bahsediyorsunuz.
20 yıl sonraki muhtemel ABD Başkanının, Rusya, Çin, Türkiye vs. tüm dünya ülkelerinin muhtemel yöneticilerinin her türlü görüntü, ses, video ve özel hayat verileri de bunun içerisinde. Günü geldiğinde tıpkı Instagram’ın yeni doğan fotoğraf uygulamalarını satın alıp yutması gibi gelecek vaat eden ve parlamaya başlayan genç siyasileri kendileriyle bu tür yöntemlerle uzlaşmaya zorlayıp zorlayamayacaklarını, aksi halde bunun olası sonuçları olup olmayacağını kastediyorum.