BeautifulSoup és ASP.NET/C#

szavazat
7

Van valaki integrált BeautifulSoup a ASP.NET/C# (esetleg IronPython vagy egyéb)? Van BeautifulSoup alternatív vagy egy port, ami működik szépen ASP.NET/C#

A szándék az tervezi, hogy használja a könyvtár kivonat olvasható szöveget bármilyen véletlenszerű URL-t.

Kösz

A kérdést 28/07/2010 21:23
a forrás felhasználó
Más nyelveken...                            


3 válasz

szavazat
10

Html Agility Pack van egy hasonló projekt, de a C # és .NET


EDIT:

Kivonat minden olvasható szöveggel:

document.DocumentNode.InnerText

Megjegyzendő, hogy ez vissza fog térni a szöveges tartalom <script>címkék.

Rögzíteni, hogy, akkor távolítsa el az összes <script>tag, mint ez:

foreach(var script in doc.DocumentNode.Descendants("script").ToArray())
    script.Remove();
foreach(var style in doc.DocumentNode.Descendants("style").ToArray())
    style.Remove();

(Credit: SLaks )

Válaszolt 28/07/2010 21:26
a forrás felhasználó

szavazat
0

Tudom, hogy ez elég régi, de úgy döntöttem, hogy tegye ezt a jövőben is. Azért jöttem át ezt keres egy hasonló megoldás.

Találtam egy könyvtár épül a HTML Gyorsasági Pack nevű scrapysharp

Én is használtam teljesen hasonló módon, mint azt BeautifulSoup https://bitbucket.org/rflechner/scrapysharp/wiki/Home

Válaszolt 04/07/2013 14:44
a forrás felhasználó

szavazat
2

Próbáld meg annak ellenére, hogy jelenleg néhány hibát:

http://nsoup.codeplex.com/

Válaszolt 06/10/2013 16:13
a forrás felhasználó

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more