c#如何将网站的内容读取为文本
本文关键字:读取 文本 网站 | 更新日期: 2023-09-27 18:12:17
如何获取网站内容?
我所说的网站只是一个简单的页面,上面没有任何其他链接:
以以下内容为例:http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html
我只是想读取内容并将其保存为字符串,以便以后我可以轻松地操作它。
任何想法?或教程吗?
提前感谢:)
using(System.Net.WebClient wc = new System.Net.WebClient()) {
MessageBox.Show(wc.DownloadString("http://thewebsite.com/thepage.html")); // Or whatever
}
我需要更多的解释,除非我只是在密集。
您想从命令行捕获这个URL的输出吗?
如果是,可以使用
wget -q "http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html" -O captured_file.txt
再次,如果我完全误解了这个请求,请原谅我…
可以使用System.Net.WebClient类方法
像这样?
/// ---- ScreenScrape --------------------------------
///
/// <summary>
/// Input: URL like "http://www.microsoft.com"
/// Return: HTML string of site
/// </summary>
static public String ScreenScrape(String URL)
{
WebRequest TheRequest = WebRequest.Create(URL);
WebResponse TheResponse = TheRequest.GetResponse();
StreamReader TheStreamReader = new StreamReader(TheResponse.GetResponseStream(), Encoding.UTF8);
String HTML = TheStreamReader.ReadToEnd();
return HTML;
}