访问.html页面的最有效方法是什么
本文关键字:有效 方法 是什么 html 访问 | 更新日期: 2023-09-27 18:32:26
我有一个.html页面,上面只有 5 个字符(4 个数字和一个句点)。
我知道的唯一方法是制作一个导航到 URL 的网络浏览器,然后使用
browser.GetElementByID();
但是这使用IE,所以我确定它很慢。有没有更好的方法(不使用 API,C# 中内置的东西)以您可以阅读的方式简单地访问网页?
试试这 2 行:
var wc = new System.Net.WebClient();
string html = wc.DownloadString("http://google.com"); // Your page will be in that html variable
您似乎想下载一个 url,将其解析为 html,然后找到一个元素并读取其内部文本,对吗?使用 nuget 获取对 HtmlAgilityPack 的引用,然后:
using(var wc = new System.Net.WebClient()){
string html = wc.DownloadString("http://foo.com");
var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
var el = doc.GetElementbyId("foo");
if(el != null)
{
var text = el.InnerText;
Console.WriteLine(text);
}
}
不使用任何 API?您使用的是 .NET 框架,因此您已经在某种程度上使用了抽象层。但是,如果您想要没有任何插件的纯 C#,您只需打开站点的 TCP 套接字并下载内容(毕竟它只是一个格式化字符串)并读取数据。
这里有一个类似的问题:如何通过TcpClient获取页面?