[]

Eksisozluk'te bir kisinin tum entryleri

Eksisozluk'te bir kisinin tum entrylerini otomatik kaydedecek bir script ariyorum. Goreniniz duyaniniz iki dk. bir el atmak isteyeniniz var mi?
Tesekkurler.



 
Şöyle bir duyuru açmıştım vaktiyle: www.eksiduyuru.com

Arkadaşın söylediği şeyi sonrasında yerine getiremedim, ne yalan söyleyeyim biraz karışık geldi. Eğer anlarsanız ve uygulayabilirseniz bir tarif rica edeceğim :)
  • sevgikusunkanadinda  (09.09.15 02:56:24) 
su an pcde degilim pcye gectigimde ustteki entry'nin nasil yapilacagini anlatabilirim. Su an calismiyo olabilir sozluk url yapisi tekrar degisti ise.

github.com
  • eksi sozlukte eksiyen adam  (09.09.15 03:08:11) 
eksi sozlukte eksiyen adam, vallahi çok makbule geçer... Teşekkürler şimdiden :)


  • sevgikusunkanadinda  (09.09.15 03:22:24) 
@eksi sozlukte eksiyen adam,

Calistirinca soyle bir hata aliyorum:

Traceback (most recent call last):
File "xxx/eksi_sozluk_entry_yedekleyici.py", line 88, in <module>
ey.start_fetching()
File "xxx/eksi_sozluk_entry_yedekleyici.py", line 69, in start_fetching
tarih = entry_tree.find(".//time").text.strip()
AttributeError: 'NoneType' object has no attribute 'text'


Ek olarak, eksisozluk sol frame'deki ilk sayfaya pagination yerine "daha da" diye sacma bir sey koydugu icin tum sayfalari da alamayacak gibi duruyor. "daha da" linkini tikladiktan sonra normal sayfa sayisini gorulebiliyor.
  • f_d  (10.09.15 05:31:06) 
bi inceliyim şimdi, muhtemelen yine bir şeyleri değiştirmişler.


  • eksi sozlukte eksiyen adam  (10.09.15 08:49:57) 
selam,

scripti tekrardan güncelledim, kendi entrylerimin 22 sayfasını da yedek olarak aldı. tekrar deneyebilir misiniz, github'dan tekrar indirmeniz gerekli.

github.com
  • eksi sozlukte eksiyen adam  (10.09.15 09:28:16) 
Cok tesekkur ederim. Eksisozlukteki yaklasik 50 sayfalik yedegi basariyla aldim.

Daha da gelistirmek isterseniz su geribeslemeleri onerebilirim:
- Koda goz attigimda nedenini cikartamadim ama surmesi gerektiginden cok uzun surdu. Entry basina yaklasik 14 saniye almis. Yani benim yedeklemem toplamda 9 saati gecti.
- Duzenli yedek almaya elvermek icin yedeklenecek sayfa sayisi parametre olarak tanimlanabilir.
- Linkleri html etiketleri ile birlikte almis gozukuyor.
  • f_d  (11.09.15 07:08:11) 
@sevgikusunkanadinda,

windows'a asina olmadigim icin birebir tarif edemiyorum ama "python dosyasi calistirma" seklinde tercihen ingilizce aratirsaniz calistirmak icin gerekli adimlara ulasmaniz daha kolay olur diye dusunuyorum.
github baglantisindaki .py uzantili dosyayi indirip bu dosyayi calistirmaniz gerekli.
  • f_d  (11.09.15 07:16:26) 
eğer windows'taysanız, python runtime'ından dolayı windowsta daha yavaş çalıştığnı okumuştum. ben 25 sayfalık yedeği 15-20 dakikada almıştım. diğer dediğin önerileri ister github'ta issue olarak açabilirsin canı isteyen de fixleyebilir, github hesabın yoksa ben issue'yu açıyorum.

zaten bu html'den crawl etme işleri sakat, en ufak bir şeyi değiştirseler bozuluyor her şey.
  • eksi sozlukte eksiyen adam  (11.09.15 08:42:47) 
1
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler angelus, Artibir, aychovsky, baba jo, basond, compumaster, deckard, duyulmasi gerektigi kadar, fader, fraise, groove salad, kahvegibi, kaymaktutmayansicaksut, kibritsuyu, monstro, pandispanya, robin, ron dennis
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.