如何从HTML检索值

本文关键字:检索 HTML | 更新日期: 2023-09-27 17:49:14

我正在尝试从控制台应用程序中的HTML字符串中提取值。

这个MSDN几乎解释了我想要什么,就像这个Get html元素按值

在我的控制台应用程序中,我的函数看起来像
    public void MyMethod()
    {
        var myValue = GetValueFromHtml("<a href='"#'">My Link</a>");
    }
    internal string GetValueFromHtml(code)
    {
       //mycode   
       //returns My Link
    }

我可以使用字符串操作,在第一个>上分割,然后在这个新值上分割'<'。

我想我也可以试着把它转换成XDocument(虽然期望是抛出非法字符,但我仍然是可行的),但总的来说,它似乎有点过分?我尝试使用XElement,但抱怨,因为我有<标签

我假设我可以使用HtmlElement.GetValue()来实现同样的事情,但我不知道如何当我不工作数组/列表?

如何从HTML检索值

我建议你使用htmllagilitypack(可从NuGet获得):

string html = "<a href='"#'">My Link</a>";
var node = HtmlNode.CreateNode(html);
string value = node.InnerHtml; // "My Link"
string html = "<a href='"#'">My Link</a>";
XElement elem = XElement.Parse(html);
Console.WriteLine(elem.Value);  // output: My Link