OCR用于从cedula/passport中提取文本

本文关键字：提取取文本 passport 用于 cedula OCR | 更新日期: 2023-09-27 18:02:38

我正在寻找Tesseract或谷歌的Vision API类型的OCR，这可以帮助提取护照/身份证图像中的文本信息，(可以从移动设备捕获或可以扫描)。因此，帧大小可能会有一点变化)。我已经通过了几个帖子，并发现Tesseract是首选的解决方案。

我还使用Vision API测试了我的测试数据，并获得了99%准确和令人满意的结果。但我有以下问题/要求:

Tesseract是我在大多数帖子上发现的建议解决方案，但它给出了非常糟糕的结果，因为框架可能会有所不同。我不能训练数据，我可以使用任何付费库来帮助我。
视觉API给出准确的结果，但我的要求是而不是使用基于云的解决方案。
有少数提供商(例如，LeadTool, IdScan等)提供此功能，但他们首先使用他们的扫描仪扫描护照。因此，他们的SDK适用于他们的扫描仪设备。

摘要:是否有可用的(付费或开源) c#库可用，它以护照/cedula图像作为输入，并返回准确的文本?如有任何建议或帮助，我将不胜感激。

OCR用于从cedula/passport中提取文本

MicroBlink公司创建了BlinkID SDK来扫描护照，身份证。它不是免费用于商业用途，而是免费用于开发。链接到SDK的网站在这里。Tesseract OCR工具可能会给您错误的结果，因为您可能在OCR扫描之前没有对图像进行任何处理，如果您想要正确的结果，这是强制性的，特别是对于护照和身份证等图像。对于图像处理，你可以使用OpenCV(免费)，但它可能需要你花时间来学习计算机视觉和图像处理(这实际上是非常有益的)。

我是MicroBlink的一名开发人员，这是一家专门开发条形码和OCR解决方案的公司。

宇宙魔方确实是你的选择之一。《Tesseract》的问题在于，很难设置正确的参数来获得真正准确的OCR结果。您仍然需要在OCR结果之上实现数据提取逻辑。在iOS/Android上集成需要两个独立的代码库。

Google Cloud Vision给出了非常准确的OCR结果，但正如你所说，它在服务器端执行图像处理，这引起了通过网络向第三方发送私人ID信息的隐私和安全问题。

有其他公司开发具有类似属性的类似产品(服务器端，无数据提取等)

MicroBlink的BlinkID的不同之处在于它在本地执行所有处理(没有服务器端连接)。它使用我们专有的基于机器学习的OCR引擎来确保正确捕获数据。它支持MRZ, PDF417条形码，并扫描一些身份证件的正面(如英国驾照，马来西亚身份证，欧盟身份证…)。所有ID数据按照国家标准进行解析和验证，并进行校验和验证。

BlinkID提供原生iOS, Android和Windows Phone 8 sdk, Phonegap/Cordova插件(iOS和Android)， Xamarin组件(c#) (iOS和Android)。

也有服务器端库(可根据要求提供)，它可以在Linux/Windows/MacOS上运行，具有C API，可以在。net应用程序中使用c++/CLI。我们的开发团队在这里帮助集成到。net应用程序中。

请联系support@microblink.com了解更多信息。

Asprise c# . net OCR和条形码识别SDK可以识别护照和其他身份证件上的正常文本，MRZ数据和条形码。MRZ数据的准确率非常高。

您可以简单地传递像BMP, JPG, PNG, PDF或TIFF格式的输入图像。

许多政府机构使用Asprise OCR读取护照MRZ信息。

您可以联系Asprise支持以获取针对您的场景的特殊评估版本。

只是关于LEADTOOLS需要…

"先用他们的扫描仪扫描护照。因此他们的SDK适用于他们的扫描仪设备"

这部分不正确。我们不制造或销售任何类型的扫描设备。LEADTOOLS sdk可以使用不同的标准设备(Windows上的Twain和WIA, Linux上的Sane，以及使用操作系统自己的api的Android和iOS设备上的相机)。然后通过软件完成OCR和ID识别。