c# kullanarak bilgisayardaki bir html dosyasını parse ederek bazı bilgileri çekmek istiyorum. internette bayağı baktım, mshtml sınıfını kullanmam gerektiğini falan gördüm ama bir türlü beceremedim. şöyle olayı anlayabileceğim açıklamalı bi kullanım örneği falan var mı bildiğiniz.

not: ek dll falan kullanmak istemiyorum onu belirteyim


 

(bkz: regex)

diyelim id'si test olan bir div'in icerigini almak istiyorsun,
Regex re = new Regex("<div id=\"test\">(.*)</div>");
seklinde bir regex yazman gerekiyor. istedigin gibi genisletip gelistirebilirsin tabi. ondan sonra aldigin veriyi de islemek sana kaliyor.

sourlemonade

teşekkürler ama bu sanki olayın daha sonraki kısmı oldu gibi :)

mesela bilgisayardaki a.html dosyasını açmak için mshtml kullanmam gerekmiyo mu. yoksa direk filestream falan da kullanabiliyo muyum?

iterator

StreamReader sayfa = new StreamReader(@"C:\hede.html",Encoding.Default);
isini gormesi lazim?

msdn.microsoft.com

sourlemonade

tamamdır buraya kadar süper, şimdi son soru bununla çektim bi stringe attım mesela hepsini(ki yaptım :) daha sonra onun içinde uyan yeri bulmak için regex'i nasıl kullanabiliriz.. çok teşekkürler bu arada..

edit: tembellik edip bakmadan sormuşum bi bakınca gördüm. teşekkürler tekrar ;)

iterator

C# taki WebBrowser kontrolünüde kullanabilirsin, elindeki dosyayı sunucu gibi gösterebileceğin biryere at. WebBrowser kontrolünden o sayfaya gir ve webbrowser sınıfının fonksiyonlarına bir bakıver, baya kullanışlı fonksiyonlar var.

sekizbit
1

mobil görünümden çık