OCR 使用Microsoft办公文档图像库的图像

本文关键字:图像 文档 使用 Microsoft OCR | 更新日期: 2023-09-27 18:33:11

如何使用MODI对彩色图像进行OCR。我已经转换了使用 Paint 创建的.tif图像并从中获取文本,但它不适用于彩色图像。如何处理彩色图像,以便我可以从中提取文本。

我将此代码用于 ocr

 MODI.Document md = new MODI.Document();
            md.Create(@"c:'test3.tif");
            md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, false, false);
            MODI.Image img845 = (MODI.Image)md.Images[0];
            TextBox1.Text = img845.Layout.Text

;

OCR 使用Microsoft办公文档图像库的图像

您可以先通过这种方法创建灰度图像

Bitmap bmp = new Bitmap(Bitmap.FromFile("oldFile"));
for (int x = 0; x < bmp.Width; x++)
{
    for (int y = 0; y < bmp.Height; y++)
    {
        Color color = bmp.GetPixel(x, y);
        int grayScale = (color.R + color.G + color.B) / 3;
        bmp.SetPixel(x,y,Color.FromArgb(grayScale, grayScale, grayScale));
    }
}
bmp.Save("newFile");

然后在新文件上进行OCR,这是灰度

为此,您需要 OCR 引擎,互联网上有几个免费提供,有些是付费的。有一个工具——内置在.NET中的eFlow,它就是这样工作的。