如何在HTTPWebRequest中从页面中抓取文本

本文关键字:抓取 取文本 HTTPWebRequest | 更新日期: 2023-09-27 18:18:42

如何使用HTTPWebRequest从网站上抓取某些文本?

我有这个代码,但它只适用于HREF,我怎么能使它与文本一起工作?

下面是我要删除的代码:
// setup variables for scraping
int startPos = 0, endPos = 0, length = 0;
string tempString = "";
// do the scraping
startPos = html.IndexOf("");
endPos = html.IndexOf(">", startPos);
length = endPos - startPos;
tempString = html.Substring(startPos, length);

例如,如果一个页面有这样的代码,我如何使它只刮回日记?:

<s class="hash">#</s><b>the1ddiariesareback</b></span></a>

如何在HTTPWebRequest中从页面中抓取文本

我建议使用HTML Agility Pack来下载并解析HTML。

您可以使用XPath或LINQ to XML语法查询对象模型。