使用HtmlAgilityPack进行解析时,请删除空白和换行符
本文关键字:删除 空白 换行符 HtmlAgilityPack 使用 | 更新日期: 2023-09-27 18:19:27
我尝试用HtmlAgilityPack以以下方式解析HTML:
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);
不幸的是,xhtmlString包含不必要的空格和换行符,因此htmlDoc的_text现在看起来像这样:
<html xmlns='"http://www.w3.org/1999/xhtml'">'n't<head></head>'n't<body>'n'n<p>Alle Auktionen<br /></p>'n'n't</body>'n</html>
这是我在处理身体的子元素时遇到的一个问题。
删除这些不必要的字符最简单的方法是什么?
HtmlAgilityPack是否提供了某种从换行符和选项卡中清除HTML的功能?
这是文档缩进,而不是不必要的空格和换行符。
我看不出这怎么会是个问题,但你不能只替换特殊字符,比如"''t"、"''n"吗?
通过快速搜索,我发现了这个Html敏捷包:让代码看起来整洁
也许将某些属性设置为false会对有帮助