访问.html页面的最有效方法是什么

本文关键字:有效 方法 是什么 html 访问 | 更新日期: 2023-09-27 18:32:26

我有一个.html页面,上面只有 5 个字符(4 个数字和一个句点)。

我知道的唯一方法是制作一个导航到 URL 的网络浏览器,然后使用

browser.GetElementByID();

但是这使用IE,所以我确定它很慢。有没有更好的方法(不使用 API,C# 中内置的东西)以您可以阅读的方式简单地访问网页?

访问.html页面的最有效方法是什么

试试这 2 行:

var wc = new System.Net.WebClient();
string html = wc.DownloadString("http://google.com");  // Your page will be in that html variable

您似乎想下载一个 url,将其解析为 html,然后找到一个元素并读取其内部文本,对吗?使用 nuget 获取对 HtmlAgilityPack 的引用,然后:

using(var wc = new System.Net.WebClient()){
    string html = wc.DownloadString("http://foo.com");
    var doc = new HtmlAgilityPack.HtmlDocument();
    doc.LoadHtml(html);
    var el = doc.GetElementbyId("foo");
    if(el != null)
    {
        var text = el.InnerText;
        Console.WriteLine(text);
    }
}

不使用任何 API?您使用的是 .NET 框架,因此您已经在某种程度上使用了抽象层。但是,如果您想要没有任何插件的纯 C#,您只需打开站点的 TCP 套接字并下载内容(毕竟它只是一个格式化字符串)并读取数据。

这里有一个类似的问题:如何通过TcpClient获取页面?