跳至頁尾內容

預處理

改善來自低品質掃描檔與照片的輸入內容。使用我們的預處理濾鏡來清理、校正並增強難以處理的影像,以達到最高的 OCR 準確度。

Icon Main related to 預處理
輸入色彩校正濾鏡

1

二進位化

您可直接在 IronOCR 內輕鬆將輸入內容二值化,將影像轉為清晰的黑白版本。此濾鏡能有效將文字從複雜背景中分離出來,減少雜訊,使文字擷取更輕鬆且更可靠。

學習如何:在 .NET C# 中修正圖片色彩以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply binarize affect
imageInput.Binarize();

// Export the modified image
imageInput.SaveAsImages("binarize.jpg");
C#
2

灰階

將彩色圖像轉換為灰階圖像——這是為圖像應用更進階的前置處理濾鏡所必需的關鍵步驟。

學習如何:在 .NET C# 中修正圖片色彩以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply grayscale affect
imageInput.ToGrayScale();

// Export the modified image
imageInput.SaveAsImages("grayscale.jpg");
C#
3

變更像素顏色

替換影像中的特定色域,讓您能在執行 OCR 之前移除浮水印、彩色背景或其他干擾元素。

學習如何:在 .NET C# 中修正圖片色彩以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Co/lor currentColor = new IronSoftware.Drawing.Co/lor("#DB645C");
IronSoftware.Drawing.Co/lor newColor = IronSoftware.Drawing.Co/lor.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to 預處理
輸入形態學運算

1

Dilates

加粗圖像中的字元,有助於連接文字中的斷裂線條,並提升對模糊或細小字體的辨識度。

學習如何:使用濾鏡修正圖像以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Dilate filter
imageInput.Dilate();

// Export filtered image
imageInput.SaveAsImages("dilate.jpg");
C#
2

Erodes

將圖像中的字元間距拉大,有助於分離相互接觸或重疊的字元。

學習如何:使用濾鏡修正圖像以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Erode filter
imageInput.Erode();

// Export filtered image
imageInput.SaveAsImages("erode.jpg");
C#
3

變更像素顏色

替換影像中的特定色域,讓您能在執行 OCR 之前移除浮水印、彩色背景或其他干擾元素。

學習如何:在 .NET C# 中修正圖片色彩以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Co/lor currentColor = new IronSoftware.Drawing.Co/lor("#DB645C");
IronSoftware.Drawing.Co/lor newColor = IronSoftware.Drawing.Co/lor.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to 預處理
輸入方向調整

1

校正

自動偵測並校正傾斜或歪斜的影像,大幅提升不完美掃描檔的 OCR 辨識準確度。

學習如何:在 .NET C# 中修正圖片方向以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply Deskew filter
imageInput.Deskew();
C#
2

旋轉

透過程式碼將圖片旋轉任意角度,以確保文字方向正確,方便 OCR 引擎進行辨識。

學習如何:在 .NET C# 中修正圖片方向以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Rotate the image 180 degrees clockwise
imageInput.Rotate(180);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
3

偵測方向

自動偵測頁面方向(0、90、180、270 度),有助於在 OCR 處理前進行方向校正。即使文件被倒置掃描,仍能確保高準確度。

了解如何:偵測頁面旋轉
using IronOcr;

using var input = new OcrInput();

// Load PDF document
input.LoadPdf("Clockwise90.pdf");

// Detect page rotation
var results = input.DetectPageOrientation();

// Ouput result
foreach(var result in results)
{
    Console.WriteLine(result.PageNumber);
    Console.WriteLine(result.HighConfidence);
    Console.WriteLine(result.RotationAngle);
}
C#

Icon Main related to 預處理
輸入解析度控制

1

規模

將圖片調整為最適合 OCR 的解析度,可顯著提升低解析度原始檔案的辨識準確度。

學習如何:在 .NET C# 中修正圖片方向以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply scale
imageInput.Scale(70);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
2

DPI 設定

對於缺乏元資料的低解析度圖像或掃描文件,請手動設定每英寸點數 (DPI)。提供 DPI 值可引導 OCR 引擎,並顯著提升辨識品質。

學習如何:C# Tesseract 圖片 DPI
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.TargetDPI = 300;
ocrInput.LoadImage(@"images\image.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
3

增強解析度

透過演算法提升低解析度影像的銳利度與清晰度,從模糊或像素化的原始資料中擷取文字。

學習如何:使用濾鏡修正圖像以利閱讀
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply enhance resolution filter
imageInput.EnhanceResolution();

// Export filtered image
imageInput.SaveAsImages("sharpen.jpg");
C#
4

篩選精靈

透過單一智慧化方法,套用經過精心設計的前置處理濾鏡鏈。濾鏡精靈會自動分析輸入影像,並套用最佳的修正序列,以獲得最理想的 OCR 結果。

了解如何:篩選精靈
using IronOcr;

var ocrTesseract = new IronTesseract();

// WIZARD - If you are unsure which filters to use,
// use the debug-wizard to test all combinations:
string codeToRun = OcrInputFilterWizard.Run(@"images\image.png", out double confidence, ocrTesseract);
Console.WriteLine($"Confidence: {confidence}");
Console.WriteLine(codeToRun);
C#
5

對圖像的特定區域進行 OCR 識別

透過僅鎖定圖片中含有文字的特定區域,節省處理時間。只需定義一個矩形區域,即可隔離並從表單、表格或雜亂的背景中擷取文字。

學習如何:使用 C# 透過 Tesseract OCR 擷取圖片的特定區域
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var ContentArea = new Rectangle(x: 215, y: 1250, width: 1335, height: 280);
ocrInput.LoadImage("img/example.png", ContentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
準備開始了嗎?
Nuget 下載 5,896,332 | 版本: 2026.5 just released
Still Scrolling Icon

還在往下捲動嗎?

想要快速確認成果嗎? PM > Install-Package IronOcr
執行範例 觀看您的圖片轉為可搜尋文字。

鋼鐵支援團隊

我們每週 5 天,每天 24 小時在線上。
聊天
電子郵件
打電話給我