使用HtmlAgilityPack进行解析时,请删除空白和换行符

本文关键字:删除 空白 换行符 HtmlAgilityPack 使用 | 更新日期: 2023-09-27 18:19:27

我尝试用HtmlAgilityPack以以下方式解析HTML:

HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);

不幸的是,xhtmlString包含不必要的空格和换行符,因此htmlDoc的_text现在看起来像这样:

<html xmlns='"http://www.w3.org/1999/xhtml'">'n't<head></head>'n't<body>'n'n<p>Alle Auktionen<br /></p>'n'n't</body>'n</html>

这是我在处理身体的子元素时遇到的一个问题。

删除这些不必要的字符最简单的方法是什么?

HtmlAgilityPack是否提供了某种从换行符和选项卡中清除HTML的功能?

使用HtmlAgilityPack进行解析时,请删除空白和换行符

这是文档缩进,而不是不必要的空格和换行符。
我看不出这怎么会是个问题,但你不能只替换特殊字符,比如"''t"、"''n"吗?

通过快速搜索,我发现了这个Html敏捷包:让代码看起来整洁
也许将某些属性设置为false会对有帮助