如何在页面视图源代码中获取pdf.js生成的文本

本文关键字:js pdf 文本 获取 源代码 视图 | 更新日期: 2023-09-27 18:19:42

我正在开发一个应用程序,在该应用程序中,pdf通过"pdf.js"转换为html5。项目要求是,pdf.js呈现的html应在页面视图源中包含pdf的文本,以便我们可以对其进行进一步处理。

我读过这篇文章http://www.codeproject.com/Articles/466362/Blend-PDF-with-HTML但它没有文本渲染选项。还有这个http://git.macropus.org/2011/11/pdftotext/example/

当pdf.js转换为html5时,如何在页面视图源中以div的形式获取pdf中的文本?

如何在页面视图源代码中获取pdf.js生成的文本

PDF.JS只提供一个添加在查看器顶部的文本层,以使文本可以选择,它不为图像和图形创建div-这些人工制品被渲染到html5画布上。