[]

Big data konusunda ne düşünüyor, ne biliyorsunuz?

Selam büyük vericiler,

Big data devrimi nedir? Nereye bu gidiş? Bizi neler bekliyor?

cosmicstring hocam, ermanen, aychovsky, cakabo, himmet dayı, godsparticle, sanal heywan, divit, roket herif, serabetan, m e l t e m, basond, jemjum, nicki şubabbadaludap gibi bişiy olan moleküler genetikçi aplamız ve aklıma şu anda gelmeyen ama bu konuyla ilgilenmiş kullanıcılar bir iki kelâm edebilirlerse, bek şugar olur.

Allah'a emanet olun...

 
Teknoloji inanilmaz bir hizla gelisse de herhangi bir devrim ben bilmiyorum.
Olay, yillardir olan seyin populer olmasi, genel sirketlerin bunun kullanim alanlarini anca fark etmesi.

  • f_d  (20.04.14 19:49:29) 
Kendi alanım için genel kültür seviyesinde bildi sahibiyim. Fakat kendi açımdan uzun süredir düşündüğüm bir çalışmayı (maalesef bitmeyecek gibi) örnek vereyim.

Alanım: ulaştırma

Örneğim metrobüs.

Şimdi metrobüsü bilmeyenler için anlatayım biraz. Metrobüs eskiden çevre yolu olan şimdi sadece şehir içi yol işlevi gören bir yolun ortasında kendisine ait yolda ilerleyen otobüs.

Şimdi bu metrobüs denen ulaşım sisteminin ciddi sıkıntılarının biri yoğun saatlerde ara duraklardan binmek imkansıza yakın oluyor. Çünkü metrobüsler 3-4 belirli duraktan yolcu alıp yolculuğuna başlıyor ara duraklarda ise otobüs zaten dolmuş oluyor.

Otobüsler de sabit bir çizelgeye göre işletiliyor bu hatta. Yani özel etkinliklerin olduğu talebi uçuran gün ile yaz tatilindeki herhangi bir gün arasında fark yok.

Şimdi herkes zaten turnikeden geçerken istanbul kart denen bir şey okutmak zorunda kalıyorlar. Bu da bir insanın durağa gelirken aslında sisteme haber vermesi anlamına geliyor. Bu veriler toplanıp daha sonra aylık ve yıllık istatistik olarak işleniyorlar. Halbuki bunları online olarak (hepsini değil de durağa gelen kişi sayısını) canlı canlı işleseler ara duraklardaki yığılmayı modelleyebilirler. Bu yoğun saatlerde atıyorum 9. durakta bir aşırı yoğunluk olduğunda o duraktan kalkacak bir boş otobüsle o duraktaki bekleme süresinin azaltılması anlamına gelebilir.

Bunun yanı sıra işleten açısından bakarsak, bazen talep düşük olduğu halde bayağı otobüsün işletildiği durumlar oluyor (nadir de olsa). Bu da verimi düşürüyor. Halbuki yine turnikelerden geçen sayısını bilsek eğer düşükse otobüsleri ilk duraktan hemen kaldırmak yerine biraz bekletsek daha verimli bir sistem oluşturabiliriz.

Tabii 50 km'ye yakın bir hat bu. Ve buradan gelecek bütün bu verilerin anında işlenmesi oldukça zor şu aşamada belki ama üzerine yatırım yapılsa toplu taşıma alanında dünyaya örnek olabilecek güzel bir proje olabilir(di).
  • godsparticle  (20.04.14 20:16:52 ~ 20:54:50) 
Ne yazık ki aşırı overrated bir kavram haline geldi. Hangi şirkete sorsan "Big Data" ile bir şeyler yapıyor. Firmaların ezelden beri yaptıkları CRM çalışmaların adı bir anda "Big Data" oldu.

Hatta güzel de bir yazı var big data'nın her zaman bir işe yaramadığı hatta gayet de yanlış yönlendirdiği konusunda

www.ft.com
  • salihdt  (20.04.14 20:24:24 ~ 20:24:59) 
ya beyler tam da bu konuda uğraşan biri olarak yok mu miner bilen:

www.eksiduyuru.com


duyuruya yanıt olarak ise:
Türkiye'de big data'nın değeri henüz tam anlaşılmış değil bence
CRM'de çok basit şeyler yapılıyor olabilir daha derinlere inmek lazım
  • ferit85  (20.04.14 20:32:46) 
@cosmicstring hocam, her zamanki altın vuruşunuzu yapmışsınız cevâbınızın sonunda...

@godsparticle, mükemmel bir örnek ve mükemmel bir düşünce! aychovsky, yavrum, metrobüsün problemini çözsen çözsen sen çözersin. bi yoğunlaş şu konuya, gözünü seviyim! boşver şimdi partiyi, belediyeyi. vatandaş perişan! çok hayır duası alırsın bak!

diğer cevaplara da cevap yazacam sonra...
  • compadrito  (20.04.14 20:48:48) 
Aslında ortada çok çılgın atan bir devrim yok. Excel veri sayısından kasılmaya başlayınca big data oldu :P

Şu anda çok sayıda veri içeren iki proje üstüne çalışıyorum. İkisi de tahmin. Biri iki gün önceden rüzgar hızı tahmini, diğeri de bir web sitesinde iş özelliklerinin girilmesi ile birlikte fiyat ve fiyat aralığı tahmini.

Bu tahminleri hızlı ve daha az hatalı yapabilmem için birçok şeye ihtiyaç duyuyorum. Doğru ve kaliteli veri, altyapısı iyi bilgisayarlar veya iş istasyonları (şu anda 12 çekirdek kullanıyorum), veriyi tahmin edecek yöntem ve algoritmalar silsilesi (en uygun olanını seçmem gerek). İki tahmin için de birçok algoritma hazır durumda ve test edilmeyi bekliyor. Literatürde canavar gibi çalıştıkları iddia ediliyor, iş istasyonlarımız zaten hızlı ama ki verimiz "imperfect". Kocaman "big-fat data"mız var ama verimizin doğruluğu kuşkulu. Şu anda zaten sorunum verinin fazlalığı değil, verinin yanlışlığı.

Web sitesi örneğini şirket bilgisi vermeden, birtakım metaforlarla açayım. Örneğin, internet üzerinden araba alıyorsun ve bunun için renk, marka, km bilgisi gibi sorular soruluyor sana ama bu soruların cevapları olarak veritabanında sadece tüm arabaların ortak verileri tutuluyor. Arabanın diğer arabalardan farkını belirten ana ve anahtar özelliklerin çoğu da veritabanının dibinde bir yerlerde, çok dandik şekilde tutuluyor. Dandikten kastım, veritabanının tamamen "Kervan yolda düzülür" modeli ile yolda düzülmüş olması; verinin yapısı belli değil, aynı veri farklı tiplerde saklanıyor, eskiden daha farklı kaydediliyormuş, orada bir eksik çıkmış ya da başka soru-cevap eklemişler, şimdi daha farklı kaydediyorlar ve 1000'den fazla alt segmentin kriptolarını çözmek, sorgular yolu ile ulaşmak imkansız. Hazır veritabanı prosedürleri de "Saldım çayıra, mevlam kayıra" cinsinden. Dolayısıyla genel özellikler elimde var ve asıl belirleyici özellikleri veri olarak kullanamıyorum. Ayırıcı veriler birkaç segment için var, onların tahminleri nokta atışı bile süper oluyor ama bu sadece iki segment, yanında 123 diğer segmentler var ki iyi tahmin için ne totemler yapıyoruz. Bu durumda bol bol "Keşke data small olsaydı da düzgün olsaydı" diyorum.

O halde elimizdeki veri ile tahmin etmeye çalışalım. Normalde bir web sitesinde "Lütfen fiyat tahmininiz yapılırken bekleyiniz" yazısı çıktıktan sonra kaç saniye bekler bir ortalama müşteri, on dakika o yazının çıkmasını beklemez. Hatta iki dakika da beklemez. O nedenle hedefimiz beş saniye. Ama bu "imperfect" ve "unclean" veri ile beş saniyede ancak veri temizlemeleri, ayıklamaları yapabiliyoruz ve ortalamada nokta fiyatından %125 sapmalı, fiyat aralığını da %25 oranında tutturan tahminler yapabiliyoruz 12 çekirdekli iş istasyonunda. (Varolan sistem %5000 sapma ile çalışıyor). Kaotik denilen rüzgar hızı ve yönü tahminlerini aslında hiç de kaotik olmayan, sadece zaman içinde fiyatın artma trendine sahip olduğu basit sistemden daha rahat ve daha az hatalı tahmin edebiliyorum.

Dolayısıyla verinin sayısı, kalitesi kadar önemli değil. Veri tutma sistemi ve işleme sistemi düzeltilmedikten sonra "big data" olur, hatta yakın gelecekte "even bigger data" bile olur onun adı ama karşımızda data çöplüğü oldukça yapılabilecekler hala kısıtlı. Aynı şekilde işleme kapasitesi de yine datanın sayısından önce gelen başka bir özellik. Veri kalitesi ve işleme kapasitesi sorununu düzeltmeden big data ile çılgın attırmak imkansız. Süreçlerin en zayıf halkası zaten veri sayısı değilken veriyi şişmanlatmakla nereye kadar gidilebilir. Araba fiyatı ile ilgili kafadan bir fiyat atsam tuttururum ama algoritmalara hesaplattırana kadar taklalar atıyoruz.

Bence bundan sonra iki kırılım olacak. Her zaman bir basitleştirme, bir de karmaşıklaştırma yolu olur. Bir süre "even bigger"a kadar yolu olacak bu dataların, oradan da big data yerine sistemi temsil eden en az sayıdaki veriyi en doğru şekilde seçen algoritmalara gideceğiz bence. Hatta, neden ben bunu çalışmıyorum.

Ekleme: Hadi kapasite ve veri kalitesi sorunu çözüldü. Ortalıkta hala bir algoritma sorunu var. "No Free Lunch" teoremi diyor ki bir algoritma bir şeyi iyileştirse başka tarafı kötüleştirir; algoritma fakir battaniyesi gibidir, başını örtsen ayağın (ya da kaba etlerin), orayı örtsen başın açıkta kalır. Algoritma işleme yöntemleri de daha iyi işleme yapabilmek için basitten karmaşığa geldi, bir iki parametreli algoritmalardan başlayıp en son veriyi işlemeye başlamadan önce 13 tane parametreyi "tune" etmem gereken bir algoritma ile sessiz kuyularda kimsesiz kaldım. Bu nedenle bir algoritma devrimi de gerekiyor. Koskoca teorem çökertilecek değil ama, basitlik-performans-süre-sonuç kalitesi ölçütleri arasında biraz da bir çılgın kırılma noktasına da ihtiyaç var. Belki bir kırılma noktası minimum sayıda uygun veriyi seçmek yanında bir yol ayrımı ile yeni ve iyi bir algoritma kırılması da olabilir.

Ekleme2: Bir arkadaşım da şu anda Türkiye'nin en çok bilinen, büyük şirketlerinden birinde bir proje yapıyor. Yine bu "big-fat data" kendisine sunuluyor ama şu şart ile birlikte: "Biz şu ve şu yazılımı aldık, o yüzden yöntemin şu ve şu ile sınırlı". Dataya bakıyorsun ve aslında sana "Ben aslında başka bir X yöntemi ile çok süper çözülürüm" diye bağırıyor, bu kadar kab-bak gibi ne yapılacağı net veri yoktur ülkede. Arkadaş da dayanamayarak bir de o X yöntemle çözüp veriyi mutlu ediyor ama adamların yatırımı boşa gitmesin diye dataya parende attırarak, slalom yaptırarak daha dandik bir veri işleme süreci elde edilmek zorunda kalınıyor. Demek ki veriden önce zihniyet de değişmeli.

Ekleme3: Bir de kaç veriden sonrası "big" acaba?

Ekleme4: Trafikçi ben değilim, başka iki arkadaşım. Ama onlar yaparsa, ben mutluluktan uçarım. Mağdur oluyoruz. :)
  • aychovsky  (22.04.14 07:13:29 ~ 09:14:27) 
Adımız anılmış, iki kelam edelim :)

Big Data'yı ilk olarak 1.5 sene kadar önce bir seminerde duydum. Ondan 1-2 ay sonra da CRM alanında kendisiyle haşır neşir oldum. Müşteri değerini hesaplarken kullandığımız 50 tane faktör var ancak big data ile bunu 500 hatta 5.000 yapmak mümkün.

Önemi giderek artacak, bu kesin. Ancak diğer cevaplarda yazıldığı gibi verinin kaydedilmesi, sonrasında analizi ve yorumlanması zaman alacak bir süreç. Bu döngünün hızlanması ise teknoloji ile doğru orantılı olacak.

Modelleme konusunda çalışan bir arkadaşımın en büyük hedefi maç skorunu tahmin modellemesi yaratmaktı. Bir maça ilişkin alabileceği tüm veriyi modellemeye dahil edip maçın skorunu tahmin etmek istiyordu. Ne aşamaya geldi bilmiyorum :)
  • cakabo  (22.04.14 08:54:08) 
Big data olayın biraz marketing bullshit tarafı, data analytics diyorlar genelde buna. Daha önceden bilgisayarlarla yapılan analizlerin kapsamı çok dardı. hafıza düşük, yer düşük, işlem gücü düşük, paralel işleme mevzuları daha yeni yeni çıkıyor falan. şimdi sikko üç beş tane sensörle bile inanılmaz veriler toplayabiliyorsun her konuda, o verileri alıp işleyip bir sonuç çıkarınca big data analizi yapmış oluyorsun olay tamamen bu.

Godsparticle'ın anlattığı örnek gibi yani. Mesela 20 milyon kredi kartı kullanıcısının satın alma verileri var elinde. Hangi saatlerde tekel bayiilerinden alışveriş yaptığını tespit edip muhtemel alkol yasağının yaratacağı tepki boyutunu düşünebilirsin, ona göre strateji planlarsın. Ya da ne bileyim alışveriş sitelerinde olan x alan bunu da aldı gibi çok basit cross marketing mevzuları bile big data içerisine giriyor. Ben mesela bir çok marka getirten bir distribütörle çalışıyorm, bizim şirketin CRM'inden toplu veri çekip benim marka ürünleri müşterielr en çok hangi başka markalarla birlikte alıyor gibi anlamlar çıkartıyorum oradan, marketingde işime yarıyor.

Bunun için tabii elindeki verinin doğru olması lazım, en çok vakit alan kısmı bu. Ne yazık ki 20 bin satırlık excel tablosu alınca bu verinin anlamlı olup olmadığını anlamak epey zor, e veri yanlışsa, yaptığın analiz de yanlış olacaktır dolayısıyla. Ama genel olarak doğru oluyor ya. Bilemiyorum çok seviyorum ben data analitik tarafını. En favori bilgi işlem aktivitem. Şakır şakır döküyorum enteresan analizleri milletin ağzı açık kalıyor.
  • roket adam  (22.04.14 09:14:07 ~ 09:16:58) 
şimdi ben genetik mühendisiyim, yani onca açıklama yapmış arkadaş gibi ne yazılım ne istatistik ne de reklamcılık alanında deneyimliyim. bu sebeple yaptıkları yorumlara a evet doğru metrobüs, o hava sahası yoğunluğu, doğru doğru google glassda kesilen hatun sayısı/tipi olarak bakabiliyorum yalnızca.

big data mevzu, adı böyle anılmıyor olsa da genetik biliminde eskiden beri ihtiyaç duyulan nokta. zaten DNA adı verilen kalıtım materyali başlı başına biyolojik bir big data örneği. bizde temel hedef bu molekülün keşfinden beri, ne demek istediğini anlamak oldu. 2000lerin başında başlatılan human genome project ile dünyadan milyonlarca sayıda insandan DNA (kandan) örneği toplanıp o gruplarda karşılaştıkları varyasyonlarla günümüzde yaşayan insan ırklarını bir tür kategorizasyona almaya, veri tabanı oluşturmaya çalıştılar. ama burada bahsettiğimiz ~30.000 protein kodlayan gen(bi bu kadar da kodlamayan bölge var ki asıl kilit nokta onlar), kromozomlarının yarısında(yarı anneden yarı babadan ya hani) 3 milyar baz var(tam bir temel DNA parçası). karşımızda da milyonlarca insan.
bu sayılar düşününce bilinen depolama sistemlerini zorluyor. çünkü çalışma milyonlarla sınırlı. asıl bilim dünyasının hedeflediği gözden tek bir varyasyonun dahi kaçmamış olması, o zaman da big data denilen mevuz devreye giriyor demek ki.
human genome projectin bu milyonluk kişiyle veri toplaması işi 2008 civarı mı neydi, bitti. burdan artık hangi gen nereyi ne şekilde kodluyor, hangi hastalık hangi genden kaynaklanıyor, bunları bulup işlemeye çalışıyorlar. bunların en büyük getirisiyse kisiye özel tıbbın gelişmesi, gereksiz ya da yanlış ilaç kullanımının önüne geçilmesi, ilacı bulunmamış hastalıkların tedavisi, organ nakillerine gerek duyulmaksızın kişinin kendi hücrelerinden lab. ortamında organ üretilebilmesi filan olacak.. ki yanlış hatırlamıyorsam sene 2011 civarı olacak, tamamen insan elinden çıkma, eldeki dataları kafalarına göre sentetik birleştirip onu da yine insan eliyle DNA bazlarını seçe yerleştire ilk %100 sentetik hücre genomu oluşturulup bir hücre yapılmış ve yaşaması sağlandı. bildiğin gözü mavi olsun (attgacgasg), kolu üç tane olsun (astgsatsatgsat), kuyruk koyalım(gastgsatgast), uçsun(asgtsagats) yöntemiyle yaptılar[a:adenin, t:timin, s:sitozin, g:guanin].
şimdi buraya kadar her şey harika. aynı ilk buhar makinesinin üretimi, radyoaktivitenin keşfi ve kullanılabilirliği gibi..
herkes hakkında elde edilen ve depolanan onlarca bilginin yalnızca insanlık yararına kullanılacağı basit tabirle naiflik.

daha hızlı ulaşımı hedeflerken daha uzun menzilli silahlar, daha güçlü enerji sistemleri hedeflerken kitlesel katliam silahları yaptık. her şeyi geçtim bu silahların üretimi uzun dönemlerin çabası ve onlarca parayla yapılıyor hep sınırlı sayıda. biyolojik yaşayan bir organizmayla yola çıktığınızda onun kendini bölüp çoğaltıp kontrolü ele almasına nasıl engel olacaksınız merak ediyorum. bu alana yabancı olanlar için şöyle örneklendireyim: elimizde yalnızca sarı ırkı etkileyebilecek silah oluşturabilecek teknoloji var. ama bunun radyoaktivite vb bir etkenle bir süre sonra mutasyon geçirip beyazları ve siyahları da asla etkilemeyeceğini garantileye bileceğimiz hiç bir yol yok.

toparlayacak olursam,
big data devriminin önüne geçilmesi mümkün değil ve harika sonuçlar yaratacak, gelişmelere yol açacak. insan ömrü yaşlanmayı durdurup ölümsüzlüğe kafa tutacak. bilinen tüm hastalıklara tedavi bulunup, mutfağımızda kendi organlarımızı 3 saatlik bir prosedürle üretebileceğiz. kızımız mavi gözlü ince belli, erkeklerimiz daha yapılı ve yaraları çabuk iyileşir olacak. ama yeni hastalıklar çıkacak. ama kısırlık ortadan kalktığında doğal seçilimi bozduğumuz için yeni nesil hep en iyi özelliklere sahip olan değil hep babası zengin olan ama geri zekalı, ama kalıtsal hastalıklı olacak. yemeklerimiz çürümeyecek ama onlardan aldığımız kaloriler de bizden asla gitmeyecek. bu defa da liposuction yaptırıp göbekteki tüm yağ hücrelerini çekince göz altı torbalarımız, kulağımızın arkası ve el bileklerimizde yağ birikecek.
ben kıyamet denilen kavramın aniden gelecek dev depremlerle dünyanın parçalanması değil elimizdeki pimi çekilmiş harika teknoloji bombalarımızla kendi uygarlığımızı yok etmemiz olduğunu düşünüyorum. big data da henüz laboratuvarda cam ardında hayranlıkla seyrettiğimiz yeni bebeğimiz.
  • shubulubapshubaptishaluva  (22.04.14 10:58:34) 
Özel hayatın gizliliği ihlal edilmediği, kişiler fişlenmediği ve bilgiler makul bir süreyle saklandığı sürece alışkanlıklarımız hakkında bilgi toplanmasını, toplumsal ve kişisel ihtiyaçlarımızın ideal biçimde karşılanmasını sağlama imkanı yaratması bakımından gayet faydalı buluyorum. Çok da ilginç buluyorum data analizlerini.


  • m e l t e m  (22.04.14 12:00:12) 
Valla bu konuda bilgim yok dostum ya, bilmediğim konuda atıp tutmayım.


  • basond  (22.04.14 18:11:26) 
@divit senden, kallavi bi cevap bekliyodum zaten. o dediğini Türkiye'de yapacak adam vardır. Türkiye'nin beyin gücünü yabana atma. Nörddür, nikotinmandır, sallamıyodur, o ayrı.

''ben hiç böyle yakaladığımız bişey görmedim etraftan da duymadım'' diyosun ama bu iş henüz emekleme dönemde. bundan sonraki 10-20 senenin, big data açısından neler getirebileceğini tahmin bile edemiyor olabiliriz.

@salihdt big data'yı CRM'e indirgemek ne derece hakkâniyetli olur emin değilim. gazetedeki yazıyı henüz okuyamadım ama mutlaka okuycam. çok teşekkür ederim cevap yazdığınız ve katkılarınız için.

@aychovsky, gene yapmışın yapacağını ve tozu dumana katmışın. yazdıklarını görebilmek içün tozun inmesini bekledim, annayabilmek içün de tekrar tekrar okumam gerekti. yannız, sana bişiy diyim mi? ben temiz verinin kıymetini bi amarigalıdan öğrendiydim, amarigaya gelmeden çok önceleri... bilmem kaç bin satırlık veriyi tek tek inceleyip, manuel olarak temizlemekten, gözleri kan çanağına döndüydü. içimden, ''bu herif sapık lan!'' diye geçirdiydim. sonradan buralarda, data cleaning, data reconciliation, data cleansing işlerine bulaşıp işin boyutlarına ve ulaştığı noktalara bi nebze olsun âşinâ hâle gelince, adama derin saygı duydum tabii.
bi zamannar bi motelde kaldıydım. kaavaltı mönüsünde portakal suyuna baktım, iki boyu vardı portakal suyunun: big, really big! really big olan, bebeykene sahilde kumdan kale yaptığımız kovalardan bile büyüktü. sen even bigger data diyince onu hatılladım. sana bişiy diyim mi? yakında, really big data diye bi laf ortaya çıkabilir, senin de öngördüğün gibi... cosmicstring hocamız, ''doğadan alınan veriler süzülmeden, en ince ayrıntısına kadar ele alınabilirse gözden kaçan pek çok şey bulunabilir'' yazmış. hemen aklıma, 17 Ağustos depreminden sonra popülerliği tavan yapan depremci hocalardan öğrendiğim ''mikroçıtırtı'' lafı geldi bu noktada. düşünsene qız, mikroçıtırtıları kaydedip biriktiriyosun ve sonradan analiz edip anlamlandırıyosun. Azerbaycanlıların mı, İranlıların mı ne, buna benzer bi çalışması vardı. Radon gazı salınımındaki değişikliği mi ne ölçüyolardı. Yukarıda, big data'yı CRM'e indirgemek ne derece hakkâniyetli olur dememin sebebi bu. Osman Pamukoğlu'nun bi sözü var: Siz savaşla ilgilenmeyebilirsiniz ama savaş sizinle ilgilenir. Ben bu sözü, big data'ya uyarlamak istiyorum. (basond hocam, aslında bu söz sana!). Siz big data ile ilgilenmeyebilirsiniz ama, big data sizinle ilgilenir. verinin temizliği konusuna dair şunu da yazmak istiyorum: insülin direnci yazımda aynı dertten muzdarip olduğumu şöyle dile getirmiştim:

**
hay allah, hic bi seyi yoktu, niye diyabet olduysa diyoruz sonra. hay allah 38 yasinda kalb krizi mi olurmus diyoruz. bunlar ne haberlere yansiyor, ne istatistiklere.

gidin bakin ölüm sebeplerine: kac tane kardiyopulmoner yetmezlik goreceksiniz?

bi akilli da cikip demez ki o anli sanli doktorlarimiza, gardaşım kardiyopulmoner yetmezlik diye ölüm sebebi mi olur? bu hasta neden öldü? asil sebep ne?
arastirip baksan, trafik kazasi, kanser, diyabet komplikasyonlari, sigaraya bagli koah, sigaraya ve sacma sapan bi hayat tarzina bagli aterosklerotik kalb hastaligi cikar altindan.

ama oraya kardiyopulmoner yetmezlik yazan bilincsiz ve egitimsiz doktorlar yuzunden, istatistikler sikilip atiliyo. rakam yok lan elimizde!!!

olcmedigin seyi kontrol edemezsin olm!!!

hay sikeyim ben boyle isi yaaa!!!!!
**

demem o ki, verin kadar konuş! ya da verinin temizliği kadar konuş! kaç veriden sonrası big acaba demişsin de, petabayt, zotabayt, zottiribayt birimleriyle ölçülenler bigdir heralda.

bu noktada, kafama zıçayım! 2006 ya da 2007 senesinde, New York Times'da okuduğum bi haberi kesip saklamadığım için... Deyecahsın ki neye? Harbiden, neye? Haber şuydu: Çinli (başka nereli olacağıdı ki zaten?) bi matematik profesörü, bi algoritma geliştirmiş. Heralda bi miktar big data kullanmıştır. Bu algoritmayı kullanarak, Wall Street'ten 1 milyar (evet milyar) dolar kaldırmış, matematike burun kıvırıp bok atannara kapak mahiyetinde! Öte yandan modern Nostradamus (ulan şu herifin adını da bi ezberleyemedim gitti bea! Çok tersime gidiyo adı. Gugıllamaya da üşendim şindi. NYU'da bildiğin hoca. Ama bildiğin hocalara hiç benzemiyo. Modellemeleri (bu modelleme lafına da ayrı bi hastayım!) ile dünyanın siyasi geleceğini tahmin ediyo. Düşün yani, CIA, adama proce ısmallıyo! Şunu şunu bi modelle hoca efendi! diyo. Hoca efendi o esnada kaç dolar kaldırıyo bilemiyorukh tabe. Procenin muhtevasını sormamız mümkin değil takdir edersin ki...

@roket adam senden de kallavi bi cevap bekliyodum ve beni yanıltmadın. teşekkür ederim. bu konuda dedenin fikrini de merak ediyorum ben asıl. ona bi özetlesen şu yaptığını da, ne düşündüğünü bi öğrensek!

@şubulububulu aplam! eline sağlık! big data'nın feriştahının sizin elinizde olduğunu bildiğimden kelli, sana yaldızlı ve beş yıldızlı dâvetiye çıkardıydım. bizi kırmayıp geldiğin içün müteşekkiriz! (bkz: george church) delisinden bahsettim miydi ben sana? Allah bilir jemjum görmüştür ya da gendinnen tanışmıştır bile! sizin alan HGP'nin açtığı devirden sonra üstel bir hızla devinecek gibi duruyo. beni en çok helecanlandıran alan diyebilirim. başlarda, meaaahhh, dağ fare doğurdu! denebilecek gelişeMEmeler yaşansa bile, asıl kırılımları, açılımları sizin tayfadan bekliyom. işalla görürüz o günneri!

@m e l t e m hanımcım, özel hayatın gizliliği filan hikâye! kimsenin hiçbişeysi gizli kalmıycak. belki şu anda bile gizli diil. hatta bilgiler ebediyen bile saklanabilir. muhtemelen biliyosunuzdur, ABD Kongre Kütüphanesi twit biriktiriyo. Bundan 50 sene sonra, araştırmacının biri 28 Mayıs 2013'ten itibaren Türkiye'de atılan twitlerin analizini yapıp oradan bir sonuç çıkarmak isteyebilir mesela. Ya da daha yeni bir tarihte gerçekleşen twit savaşlarının. Öte yandan, dünyadaki telefon ve email trafiki de, bi yerlerde birikiyo. Feysin elinde önemli veri var. Şimdi vatsaptan da gelecek önemli bi miktar. Gugıl, gugıllanan kelimelerin lokalizasyon tayinini yaparak, doğru grip salgını tahminleri yapmış. Eminim çok daha başka şeyler yapmıştır, yapıyodur ve yapacaktır.

aychovsky bana bu mini konferans için teşekkür etti, sağolsun. elimize gugıl geçince, ille de sikiş sokuş mevzularını mı gugıllıycaz? ya da elimize duyuru geçince ille de ''bi çocuk var, tatlı bişiy...'' diye başlıyan duyurular mı okuycaz? bunnardan da koyalım ara sıcak olarak. herkeş eteğindeki taşı döksün, olma mı?

hepinize, vakit ayırıp geldiğiniz ve emek verdiğiniz içün ayrı ayrı teşekkür eder, bi dahaki mini konferansımızda buluşuncaya dek, yanaklarınızdan makas alırım.
  • compadrito  (23.04.14 05:55:35 ~ 06:17:52) 
herkese "sen" bana niye hanımcım ya, 50 yaşında mıyım ben? özel hayatın gizliliği ile kastedilen her türlü gizlilik değil yalnız, kişi zaten bilgilerinin toplanıp paylaşılmasına dair söz. onaylıyor çoğu zaman.


  • m e l t e m  (23.04.14 11:59:18) 
cosmicstring hocamdan okkalı bi ef-ferim aldım olm! ben bu gaznan var ya, şindi gider işyerindeki Hintli avratlardan ikisini donumda sallar duvara vurarım! (O değil de, Çinni avratlardan biri demin mutfakta geğirdi la! Çok doğal geğirdi yannız! Hakkını teslim etmem lâzım.)

m e l t e m cim, senin taptaze bi kır çiçeği olduğunu hepimiz biliyoz. hani işyerinde Director of Compliance'ı görünce ''Saygılar efenim, he heh!'' diye yılışırsın ya, işte o hesap, ben de mesafeyi koriyim istemiştim sennen, 'fikri mülkiyetçi filan amma gene de avukat olm, hürmette kusur etme de sakata gelmeyelim' filan gibilerden, mesafeyi korurkene de sonuna bi cım koyiyim samimiyet maksatlı didiydim ama, çok haklısın, altın günnerinde konuşan aplalara benzemişsim! özürlerden özür beğen! yannız sana bişiy diycem, geyik çevirmeyi 30 yaş altının tekeline alma istersen...

comptrol abim hoşgelmiş! hele şükür! boşver siyaset yazmayı abim bea! sana bu çok daha fazla yakışıyo. yazacam soğna. şindi işim var biraz...
  • compadrito  (23.04.14 14:23:19 ~ 14:24:25) 
@compadrito vur dedik öldürdün.


  • m e l t e m  (24.04.14 01:17:41) 
m e l t e m, özürlerden bi tane daha beğen(iniz) o vakit! maymun oldum valla!

comptrol hocam, sen neymişsin de haberimiz yokmuş valla! Darısı 3 milyon dolar ödüllü yarışmalara işalla!
Cem Boyner'in annattığı bi hikâyeyi hatıllıyom: Müşterilere doğum günü tebriği mi ne postalıyolar Beymen'den ya da Çarşı'dan. Adamın birinin karısı görüyo tebriği ve merak ediyo. Halbuki Beymen'den alınma bi mevzu yok evde. Meğer herif metres'ine çamaşır almış sevgililer gününde. (O aradaki bağlantı nası kuruluyo, olay nası su yüzüne çıkıyo kısmını unuttum, uydurmiyim şindi). O olaydan sonra, Boyner grubu bu uygulamadan vazgeçmiş galiba. Hikâyeyi bana Cem Boyner annatmadı tabe, kastede okudum, he heh... (biz ne diyoduk, nerden geldik bu don mevzuuna ya?)
  • compadrito  (24.04.14 05:19:59 ~ 05:43:37) 
45/1700 demek % 2.6'lık dilim demek. Oldukça iyi bir başarı. tebrik ettim.


  • godsparticle  (06.05.14 11:26:42) 
Meğer "Big Data"dan "Deep Data"ya da bir gidiş varmış. İçimizde bizden içerü bir biz varmış, onu keşfe gidiyormuşuz
www.huffingtonpost.com

Bugün gelen bir konferans davetinde gördüm Deep Data'yı, henüz ne olduğunu ben de bu kadar biliyorum.

Bir de "Really Big" ya da "Even bigger" olanı değil de, "Huge Data" çıkmış.
www.iaria.org
  • aychovsky  (23.11.14 13:16:35 ~ 13:34:07) 
1
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler angelus, Artibir, aychovsky, baba jo, basond, compumaster, deckard, duyulmasi gerektigi kadar, fader, fraise, groove salad, kahvegibi, kaymaktutmayansicaksut, kibritsuyu, monstro, pandispanya, robin, ron dennis
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.