如何从HTML检索值
本文关键字:检索 HTML | 更新日期: 2023-09-27 17:49:14
我正在尝试从控制台应用程序中的HTML字符串中提取值。
这个MSDN几乎解释了我想要什么,就像这个Get html元素按值
在我的控制台应用程序中,我的函数看起来像 public void MyMethod()
{
var myValue = GetValueFromHtml("<a href='"#'">My Link</a>");
}
internal string GetValueFromHtml(code)
{
//mycode
//returns My Link
}
我可以使用字符串操作,在第一个>
上分割,然后在这个新值上分割'<'。
我想我也可以试着把它转换成XDocument(虽然期望是抛出非法字符,但我仍然是可行的),但总的来说,它似乎有点过分?我尝试使用XElement,但抱怨,因为我有<
标签
我假设我可以使用HtmlElement.GetValue()来实现同样的事情,但我不知道如何当我不工作数组/列表?
我建议你使用htmllagilitypack(可从NuGet获得):
string html = "<a href='"#'">My Link</a>";
var node = HtmlNode.CreateNode(html);
string value = node.InnerHtml; // "My Link"
string html = "<a href='"#'">My Link</a>";
XElement elem = XElement.Parse(html);
Console.WriteLine(elem.Value); // output: My Link