两个HTML的比较
本文关键字:比较 HTML 两个 | 更新日期: 2023-09-27 18:16:37
我正在做2 pdf比较,我提取pdf以获得pdf的样式。pdf样式被提取并转换为html。最后我比较了两种HTML文本。
对于PDF提取我使用itextsharp
代码
this.result.AppendFormat(
"<tr><td>{0}</td><td>{1}</td><td>{2}pt</td><td>{3}</td><td>{4}</td><td>",
Form1.j, curFont, font_size_client, fontweight, fontstyle);
}
this.result.Append(renderInfo.GetText());
}
public string GetResultantText()
{
if (result.Length > 0)
{
result.Append("<tr><td></td><td></td>");
}
return result.ToString();
}
这是我用于转换的代码。我的问题是一个示例PDF,我使用HTML教科书本身来比较文本。在HTMLbook中有一些风格,如背景颜色,字体大小被附加到文本。它采用的不是文本,而是样式。你能告诉我如何提取风格吗?是我选择比较2 PDF的方法是错误的。或任何其他方法。
将其提取为HTML后,可以使用jQuery获取.HTML()代码。
看这里:https://api.jquery.com/html/
之后可以比较两个结果