如何在HTTPWebRequest中从页面中抓取文本
本文关键字:抓取 取文本 HTTPWebRequest | 更新日期: 2023-09-27 18:18:42
如何使用HTTPWebRequest从网站上抓取某些文本?
我有这个代码,但它只适用于HREF,我怎么能使它与文本一起工作?
下面是我要删除的代码:// setup variables for scraping
int startPos = 0, endPos = 0, length = 0;
string tempString = "";
// do the scraping
startPos = html.IndexOf("");
endPos = html.IndexOf(">", startPos);
length = endPos - startPos;
tempString = html.Substring(startPos, length);
例如,如果一个页面有这样的代码,我如何使它只刮回日记?:
<s class="hash">#</s><b>the1ddiariesareback</b></span></a>
我建议使用HTML Agility Pack来下载并解析HTML。
您可以使用XPath或LINQ to XML语法查询对象模型。