c#如何将网站的内容读取为文本

本文关键字:读取 文本 网站 | 更新日期: 2023-09-27 18:12:17

如何获取网站内容?

我所说的网站只是一个简单的页面,上面没有任何其他链接:

以以下内容为例:http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html

我只是想读取内容并将其保存为字符串,以便以后我可以轻松地操作它。

任何想法?或教程吗?

提前感谢:)

c#如何将网站的内容读取为文本

using(System.Net.WebClient wc = new System.Net.WebClient()) {
    MessageBox.Show(wc.DownloadString("http://thewebsite.com/thepage.html")); // Or whatever
}

我需要更多的解释,除非我只是在密集。

您想从命令行捕获这个URL的输出吗?

如果是,可以使用

wget -q "http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html" -O captured_file.txt

再次,如果我完全误解了这个请求,请原谅我…

可以使用System.Net.WebClient类方法

像这样?

/// ---- ScreenScrape --------------------------------
///
/// <summary>
/// Input: URL like  "http://www.microsoft.com"
/// Return: HTML string of site
/// </summary>
static public String ScreenScrape(String URL)
{
    WebRequest TheRequest = WebRequest.Create(URL);
    WebResponse TheResponse = TheRequest.GetResponse();
    StreamReader TheStreamReader = new StreamReader(TheResponse.GetResponseStream(), Encoding.UTF8);
    String HTML = TheStreamReader.ReadToEnd();
    return HTML;
}