下载一个“;完整”;网页编程
本文关键字:完整 网页 编程 一个 下载 | 更新日期: 2023-09-27 18:27:12
我正在使用C#,我想以编程方式下载一个完整的网页。。。。。。我的意思不仅仅是页面来源
我希望下载的网页与FireFox中的"保存页面为"相同,但我想以编程方式执行此操作?
您需要下载并解析页面以找出所有外部资源,然后依次下载每个资源(可能还需要解析页面并下载其中的资源)。
对于解析HTML,我建议使用HTML敏捷包。您需要记住要下载的资源(图像、css、javascript等),并在页面中查询这些资源。
您需要记住,有些页面将定义base
,您需要考虑这一点以及具有相对和绝对链接的页面URL。
您可能还想解析CSS中的图像引用之类的内容。
最后,您需要将所有这些引用更改为指向资源下载位置的本地引用(感谢@Scott M)。