如何在 C# 中从网页中查找和提取文本
本文关键字:查找 提取 取文本 网页 | 更新日期: 2023-09-27 18:35:25
我想知道如何从网页获取数据
例:
<li id="hello1">about me
<ul class="square">
<li><strong>name: john</strong></li>
</ul>
</li>
我想在名字前面读约翰:所以我怎么不能在 C# 中读懂它哦,我尝试使用HTML敏捷包:(但是由于其文档差,我无法使用,因此需要帮助。
使用 HtmlAgilityPack
HtmlDocument doc = new HtmlDocument();
doc.Load(yourStream);
var nameElement= doc.DocumentNode.SelectSingleNode("//li[@id='hello1']").InnerText;
//name would contain `about me name: john`
Regex.Match(nameElement,@"(?<=name:'s*)'w+").Value;//john
我以前使用过HTML敏捷包,它是很棒的工具
HtmlDocument document = new HtmlDocument();
document.LoadHtml(YourHTML);
var collection = document.DocumentNode.SelectNodes("//li[@id='hello1']");