HtmlAgilityPack:如何创建缩进的 HTML
本文关键字:缩进 HTML 创建 何创建 HtmlAgilityPack | 更新日期: 2023-09-27 17:55:51
所以,我正在使用HtmlAgilityPack生成html,它运行良好,但html文本没有缩进。但是,我可以获取缩进的XML,但是我需要HTML。有办法吗?
HtmlDocument doc = new HtmlDocument();
// gen html
HtmlNode table = doc.CreateElement("table");
table.Attributes.Add("class", "tableClass");
HtmlNode tr = doc.CreateElement("tr");
table.ChildNodes.Append(tr);
HtmlNode td = doc.CreateElement("td");
td.InnerHtml = "—";
tr.ChildNodes.Append(td);
// write text, no indent :(
using(StreamWriter sw = new StreamWriter("table.html"))
{
table.WriteTo(sw);
}
// write xml, nicely indented but it's XML!
XmlWriterSettings settings = new XmlWriterSettings();
settings.OmitXmlDeclaration = true;
settings.Indent = true;
settings.ConformanceLevel = ConformanceLevel.Fragment;
using (XmlWriter xw = XmlTextWriter.Create("table.xml", settings))
{
table.WriteTo(xw);
}
Fast,
Reliable, Pure C#, .NET Core 兼容 AngleSharp
你可以用AngleSharp解析它它提供了一种自动缩进的方法:
var parser = new HtmlParser();
var document = parser.ParseDocument(text);
using (var writer = new StringWriter())
{
document.ToHtml(writer, new PrettyMarkupFormatter
{
Indentation = "'t",
NewLine = "'n"
});
var indentedText = writer.ToString();
}
不,这是一个"设计使然"的选择。XML(或XHTML,它是XML,而不是HTML)之间有很大的区别,大多数时候,空格没有特定的含义,而HTML则有很大的区别。
这不是一个很小的改进,因为更改空格可以改变某些浏览器呈现给定 HTML 块的方式,尤其是格式错误的 HTML(通常由库很好地处理)。Html Agility Pack 旨在保持 HTML 的呈现方式,而不是最小化标记的编写方式。
我并不是说这不可行或完全不可能。显然,您可以转换为XML和voilà(并且可以编写扩展方法来简化此操作),但是在一般情况下,呈现的输出可能会有所不同。
据我所知,HtmlAgilityPack不能做到这一点。但是你可以浏览类似问题中提出的html整洁包:
- Html 敏捷包:让代码看起来整洁
- 哪个是最好的 HTML 整洁包?是HTML 敏捷包中有任何选项使HTML网页整洁?
我做了同样的体验,即使HtmlAgilityPack非常适合读取和修改无法创建可读输出的Html(或在我的情况下asp)文件。
但是,我最终编写了一些对我有用的代码行:
有了一个名为"m_htmlDocument"的 HtmlDocument,我按如下方式创建我的 HTML 文件:
file = new System.IO.StreamWriter(_sFullPath);
if (m_htmlDocument.DocumentNode != null)
foreach (var node in m_htmlDocument.DocumentNode.ChildNodes)
WriteNode(file, node, 0);
和
void WriteNode(System.IO.StreamWriter _file, HtmlNode _node, int _indentLevel)
{
// check parameter
if (_file == null) return;
if (_node == null) return;
// init
string INDENT = " ";
string NEW_LINE = System.Environment.NewLine;
// case: no children
if(_node.HasChildNodes == false)
{
for (int i = 0; i < _indentLevel; i++)
_file.Write(INDENT);
_file.Write(_node.OuterHtml);
_file.Write(NEW_LINE);
}
// case: node has childs
else
{
// indent
for (int i = 0; i < _indentLevel; i++)
_file.Write(INDENT);
// open tag
_file.Write(string.Format("<{0} ",_node.Name));
if(_node.HasAttributes)
foreach(var attr in _node.Attributes)
_file.Write(string.Format("{0}='"{1}'" ", attr.Name, attr.Value));
_file.Write(string.Format(">{0}",NEW_LINE));
// childs
foreach(var chldNode in _node.ChildNodes)
WriteNode(_file, chldNode, _indentLevel + 1);
// close tag
for (int i = 0; i < _indentLevel; i++)
_file.Write(INDENT);
_file.Write(string.Format("</{0}>{1}", _node.Name,NEW_LINE));
}
}