从在线网站c#中读取html

本文关键字:读取 html 在线 网站 | 更新日期: 2023-09-27 18:19:03

我正在阅读c#网站并获得内容为字符串....有一些网站没有良好的HTML结构。

我尝试了HtmlAgilityPack和其他一些人,但他们需要格式良好的html,这在我的情况下是不可能的。

现在我需要一个非常简单的方法来读取它的Div或span id/class。

这是我的html http://jsfiddle.net/bwJU7/

请给我一个简单的c#代码,将读取

div class="item " 

和得到title, price, photosdescription在我的html

从在线网站c#中读取html

如果你将内容加载为字符串,并且不期望从中得到任何正则结构,那么正则表达式就是你的朋友。

像这样的东西可能会帮助你:

String content = "Your content goes here";
var regex = new Regex("<div(?:.*?)class='"item'"[^>]*>(.*?)</div>");
foreach (Match div in regex.Matches(content))
{               
    Console.WriteLine(div.Groups[0].Value);
}