OCR图像颜色编辑
OCR在我们阅读白底黑字时工作得更快、更准确。
如果我们有蓝色文字在粉红色背景上,例如,我们会希望在进行OCR之前将蓝色换成黑色,将粉红色换成白色。
使用System.Drawing可能非常耗时且缓慢,但使用IronOCR则完全自动化。
OcrInput.ReplaceColor 方法允许我们在文档中将一种颜色替换为另一种颜色。
它是模糊的,您可以指定一个与RGB精确值的百分比容差。
这消除了使用Photoshop或ImageMagick脚本来准备OCR图像的需要。
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("blue_and_pink.png");
ocrInput.WithTitle("Recolored");
ocrInput.ReplaceColor(Color.Pink, Color.White, 10);
// Pink detection has 10% tolerance
ocrInput.ReplaceColor(Color.Blue, Color.Black, 5);
// Blue detection has 5% tolerance
// Export the modified image so you can manually inspect it.
foreach (var page in ocrInput.GetPages())
{
page.SaveAsImage($"black_and_white_page_{page.Index}.bmp");
}
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
ocrInput.LoadImage("blue_and_pink.png")
ocrInput.WithTitle("Recolored")
ocrInput.ReplaceColor(Color.Pink, Color.White, 10)
' Pink detection has 10% tolerance
ocrInput.ReplaceColor(Color.Blue, Color.Black, 5)
' Blue detection has 5% tolerance
' Export the modified image so you can manually inspect it.
For Each page In ocrInput.GetPages()
page.SaveAsImage($"black_and_white_page_{page.Index}.bmp")
Next page
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)Install-Package IronOcr
OCR在我们阅读白底黑字时工作得更快、更准确。
如果我们有蓝色文字在粉红色背景上,例如,我们会希望在进行OCR之前将蓝色换成黑色,将粉红色换成白色。
使用System.Drawing可能非常耗时且缓慢,但使用IronOCR则完全自动化。
OcrInput.ReplaceColor 方法允许我们在文档中将一种颜色替换为另一种颜色。
它是模糊的,您可以指定一个与RGB精确值的百分比容差。
这消除了使用Photoshop或ImageMagick脚本来准备OCR图像的需要。