[]

Öyle Bi kod yazayım ki Html'den ne istersem toplasın

selam
elde bi kaç yüz internet sayfası var aynı formatta
mesela eksisözlük A şirketi sayfası, B şirketi sayfası...
chat ciipiti'ye kod yazdırıyorum
bu sayfada A a.ş'nin
ismini çek
kuruluş yılını çek
faaliyet alanını çek
bunlar htmlye gömülü, oradan çek
javascript de çalışıyor

neyse

ismi şöyle bi formatta
>
...,"name":"A anonim şirketi,LTD",...

cipiti'ye dedim ki
name'yi gördün mü, iki nokta üst üsteden başla alıntı işaretine " kadar al,
excel'e bas
bunu tam beceremiyor
kod olarak şöyle bi şey yazıyor, name:({[][%:&/,)

ismin karşısındaki değeri en güzel nasıl adreslerim
aradığım her değer aynı uzunlukta da değil

 
Kodu tam olarak hangi dilde yazmak istiyorsunuz? HTML parser olarak aratirsaniz dile bagli olarak kolay cozumler cikabiliyor. ChatGPT'yi karistirmadan da olur bence. Takilirsaniz sorarsiniz mesela.


  • mbond  (27.09.24 12:40:07) 
o kod regex ve chatgpt bunu çok iyi beceremiyor. özellikle değişiklik gerektiğinde tamamen saçmalıyor. ben kendim yazıyorum hala regexleri. selenium falan tabanlı bir örnek isteseniz daha verimli olabilir belki ama hiç denemedim.

name böyle alınabilir;

regex101.com

ama html içindeki bi json'ı parse etmeye çalışmıyoruz umarım :)
  • karincaezmezuo  (27.09.24 12:55:09 ~ 12:56:37) 
c# ile web scrapping konusuna bakmanızı öneririm. isterseniz bahsettiğiniz ai mekanizmasına da danışın. büyük ihtimal çözersiniz. eğer çözemez ve işin içinden çıkamazsanız bana output olarak ne istediğinizi anlatırsanız yardımcı olmaya çalışırım. size küçük bir parser yazarım, üzerine koyarsınız.


  • datnet  (28.09.24 02:15:30 ~ 02:15:38) 
web'den html kodu üzerinden aratarak bilgi çekilmez (daha kolay yollar var), webden html metnini alınca bir parser kütüphanesi (mesela beautifulsoup) ile taglerin id, xpath gibi belirteçlerini kullanarak çekmeniz lazım, chat-gpt bu konuda aslında yardımcı olabilir.


  • gezegen olan pluton  (28.09.24 04:12:57 ~ 04:17:15) 
1
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler angelus, Artibir, aychovsky, baba jo, basond, compumaster, deckard, duyulmasi gerektigi kadar, fader, fraise, groove salad, kahvegibi, kaymaktutmayansicaksut, kibritsuyu, monstro, pandispanya, robin, ron dennis
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.