C#从MHT文件中提取HTML

本文关键字:提取 HTML 文件 MHT | 更新日期: 2023-09-27 18:27:09

我有一个C#模块,它从HTML文件中提取信息。但我的输入是一个MHT文件。如何提取MHT文件的html部分?

C#从MHT文件中提取HTML

我尝试了几个工具&据报道,允许我提取MHT内容的库,但几乎都失败了(我发现MHT文件的提供者没有正确编码某些类型)。我最终发现了Total Commander,它让我打开MHT的包装,只提取html部分。这是一次黑客攻击,但它完成了任务。

似乎有很多工具可以创建MHT,但很少有工具可以打开它们。