[]

Ekşi Sözlük'ün "alakalı başlıklar" Algoritması Nasıl Çalışıyor?

kafayı yiycem, bilen anlatsın, bu sırra vakıf olmaya çalışıyorum.
php yazıyorum, lazım oldu. kaynak kodundan gördüğüm kadarıyla, alakalı başlıklar şu tip bir url'den js/lazyload ile çekiliyor, buraya kadar tamam:
eksisozluk.com/alakali-basliklar/baslik_id_burada

kelime eşleştirme değil, kanal eşleştirme değil, başlık içinde verilmiş bakınızlar değil, doğruluk oranı çok yüksek, tüm entryleri tarasa deli kaynak tüketir, o da değil. ne peki?

örnekler:

başlık:
uydunet

alakalı başlıklar
ttnet
turkcell superonline fiber internet
superonline
turkcell superonline
d-smart net

veya

başlık
evren

alakalı başlıklar
big bang
turan dursun
evrende dinin yeri
öğrenildiğinde ufku iki katına çıkaran şeyler
carl sagan

 
Bilen biri degilim ama, fikir yurutme acisindan diyorum, basliklarin bizim goremedigimiz tagleri mevcut olabilir mi? Ayni tagde yer alan konulari random oneriyordur belki


  • veritaslibertas  (16.05.17 18:22:58) 
@veritaslibertas

sözlükte milyonlarca entry var ve yazarlar entry girerken herhangi bir tag belirtmiyor. bu taglerin moderasyon tarafından el ile girilmesi ihtimali de imkansıza yakın.
  • işimdeyim gücümdeyim  (16.05.17 18:24:43) 
ben de fikir yurutucem. evren basliginda en fazla big bang'e bkz verilmis olabilir mesela. verilen bkz'lara gore alakali basliklar oneriliyor olabilir yani.


  • hopeless  (16.05.17 18:29:33) 
@hopeless

hayır, maalesef algoritma buna göre çalışmıyor.
  • işimdeyim gücümdeyim  (16.05.17 18:35:44) 
buralarda eksi'de calisan bi developer vardi belki o yardimci olabilir.

jaccard, cosine gibi benzerlik algoritmalarindan biri vardir muhtemelen. basliklardan gecen kelimeleri kumeleyip buna gore clusterlar olusturuyordur.
  • fakyoras  (16.05.17 19:25:42) 
1
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler angelus, Artibir, aychovsky, baba jo, basond, compumaster, deckard, duyulmasi gerektigi kadar, fader, fraise, groove salad, kahvegibi, kaymaktutmayansicaksut, kibritsuyu, monstro, pandispanya, robin, ron dennis
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.