如何在 C# 中从网页中查找和提取文本

本文关键字:查找 提取 取文本 网页 | 更新日期: 2023-09-27 18:35:25

我想知道如何从网页获取数据

例:

<li id="hello1">about me
    <ul class="square">
        <li><strong>name: john</strong></li>
    </ul>
</li>

我想在名字前面读约翰:所以我怎么不能在 C# 中读懂它哦,我尝试使用HTML敏捷包:(但是由于其文档差,我无法使用,因此需要帮助。

如何在 C# 中从网页中查找和提取文本

使用 HtmlAgilityPack

HtmlDocument doc = new HtmlDocument();
doc.Load(yourStream);
var nameElement= doc.DocumentNode.SelectSingleNode("//li[@id='hello1']").InnerText;
//name would contain `about me name: john`
Regex.Match(nameElement,@"(?<=name:'s*)'w+").Value;//john

我以前使用过HTML敏捷包,它是很棒的工具

HtmlDocument document = new HtmlDocument(); 
document.LoadHtml(YourHTML);
var collection = document.DocumentNode.SelectNodes("//li[@id='hello1']");