从在线网站c#中读取html
本文关键字:读取 html 在线 网站 | 更新日期: 2023-09-27 18:19:03
我正在阅读c#网站并获得内容为字符串....有一些网站没有良好的HTML结构。
我尝试了HtmlAgilityPack
和其他一些人,但他们需要格式良好的html,这在我的情况下是不可能的。
现在我需要一个非常简单的方法来读取它的Div或span id/class。
这是我的html http://jsfiddle.net/bwJU7/
请给我一个简单的c#代码,将读取
div class="item "
和得到title
, price
, photos
和description
在我的html
如果你将内容加载为字符串,并且不期望从中得到任何正则结构,那么正则表达式就是你的朋友。
像这样的东西可能会帮助你:
String content = "Your content goes here";
var regex = new Regex("<div(?:.*?)class='"item'"[^>]*>(.*?)</div>");
foreach (Match div in regex.Matches(content))
{
Console.WriteLine(div.Groups[0].Value);
}