两个HTML的比较

本文关键字:比较 HTML 两个 | 更新日期: 2023-09-27 18:16:37

我正在做2 pdf比较,我提取pdf以获得pdf的样式。pdf样式被提取并转换为html。最后我比较了两种HTML文本。

对于PDF提取我使用itextsharp

代码

  this.result.AppendFormat(
     "<tr><td>{0}</td><td>{1}</td><td>{2}pt</td><td>{3}</td><td>{4}</td><td>", 
    Form1.j, curFont, font_size_client, fontweight, fontstyle);
        }
  this.result.Append(renderInfo.GetText());
        }
  public string GetResultantText()
  {
      if (result.Length > 0)
      {
          result.Append("<tr><td></td><td></td>");
      }
      return result.ToString();
  }

这是我用于转换的代码。我的问题是一个示例PDF,我使用HTML教科书本身来比较文本。在HTMLbook中有一些风格,如背景颜色,字体大小被附加到文本。它采用的不是文本,而是样式。你能告诉我如何提取风格吗?是我选择比较2 PDF的方法是错误的。或任何其他方法。

两个HTML的比较

将其提取为HTML后,可以使用jQuery获取.HTML()代码。

看这里:https://api.jquery.com/html/

之后可以比较两个结果