[]

bir metin dosyasında en çok kullanılan kelimeleri bulmak

merhaba, diyelim ki altı sezonluk bir dizi var. bu diziyi ingilizce altyazıyla izlemek istiyorum ingilizcemi biraz geliştirebilmek için. sorum şu, bu dizinin altyazı dosyalarını bir kelime işlemcide toplasam, en çok kullanılan kelimeleri sırasıyla listeleyebilir miyim? bir formülü ya da kodu var mı bunu yapmanın?




 
python'da nltk ile yapılabilir.


  • ron dennis  (19.06.20 20:12:30) 
wordcounter.net şöyle bir site var ama kopyala yapıştır yapacaksınız vs daha uzun iş.


  • black holes in the sky  (19.06.20 20:38:40) 
  • rotten head  (08.07.20 16:32:33) 
1
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler angelus, Artibir, aychovsky, baba jo, basond, compumaster, deckard, duyulmasi gerektigi kadar, fader, fraise, groove salad, kahvegibi, kaymaktutmayansicaksut, kibritsuyu, monstro, pandispanya, robin, ron dennis
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.