阿拉伯语的开源 OCR
本文关键字:OCR 开源 阿拉伯语 | 更新日期: 2023-09-27 17:56:31
我正在寻找一个 OCR 库或任何可以使用它来从图像中读取阿拉伯字母的样本。我用谷歌搜索了很多,没有找到任何东西。请帮忙提前谢谢。
TesseractOCR 可能是目前最好的开源 OCR 引擎,并且在识别方面非常灵活。它允许使用自定义数据进行训练,因此基本上任何语言都是可能的,只要你愿意投入工作(即创建训练集)。
tesseract(带有GUI接口)提供了一些工具,可以帮助创建数据集,您可以在其中指定字符的边界框和相应的转录。
编辑:从另一篇文章(上面链接)中注意到,已经为3.01版创建了一个阿拉伯语训练集。您只需要插入阿拉伯语数据,您的问题就会:)解决。
您可以尝试Abbyy Fine Reader,他们可能有您正在寻找的语言。