フッターコンテンツにスキップ

前処理

質の低いスキャンや写真からの入力を改善します。私たちの前処理フィルタを使用して、困難な画像を清掃し、整え、強化し、最大のOCR精度を達成します。

Icon Main related to 前処理
入力色補正フィルター

1

2値化

IronOCRで直接入力された画像を簡単に二値化し、シャープな白黒画像に変換します。このフィルターは複雑な背景からテキストを効果的に分離し、ノイズを減らし、テキスト抽出をより簡単で信頼性の高いものにします。

Fix Image Colors for Reading in .NET C# 以下の方法を学んでください。
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply binarize affect
imageInput.Binarize();

// Export the modified image
imageInput.SaveAsImages("binarize.jpg");
C#
2

グレースケール

カラー画像をグレースケールに変換する - 画像をより高度な前処理フィルタ用に準備するための重要なステップです。

Fix Image Colors for Reading in .NET C# 以下の方法を学んでください。
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply grayscale affect
imageInput.ToGrayScale();

// Export the modified image
imageInput.SaveAsImages("grayscale.jpg");
C#
3

ピクセルカラーの変更

画像内の特定の色範囲を置き換え、OCRの前に透かしや色付きの背景、その他の邪魔な要素を取り除くことができます。

Fix Image Colors for Reading in .NET C# 以下の方法を学んでください。
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Color currentColor = new IronSoftware.Drawing.Color("#DB645C");
IronSoftware.Drawing.Color newColor = IronSoftware.Drawing.Color.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to 前処理
入力形態素演算

1

ディレート

画像内の文字を太くすることで、テキスト内の改行をつなげたり、かすれたフォントや細いフォントの認識を向上させることができます。

次の方法を学んでください:読み取りフィルタを使用して画像を修正する
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Dilate filter
imageInput.Dilate();

// Export filtered image
imageInput.SaveAsImages("dilate.jpg");
C#
2

エロデス

画像内の文字を薄くし、接触したりにじんだりしている文字を分離するのに便利です。

次の方法を学んでください:読み取りフィルタを使用して画像を修正する
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Erode filter
imageInput.Erode();

// Export filtered image
imageInput.SaveAsImages("erode.jpg");
C#
3

ピクセルカラーの変更

画像内の特定の色範囲を置き換え、OCRの前に透かしや色付きの背景、その他の邪魔な要素を取り除くことができます。

Fix Image Colors for Reading in .NET C# 以下の方法を学んでください。
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Color currentColor = new IronSoftware.Drawing.Color("#DB645C");
IronSoftware.Drawing.Color newColor = IronSoftware.Drawing.Color.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to 前処理
入力方向の操作

1

デスキュー

斜めや傾いた画像を自動的に検出してまっすぐにし、不完全なスキャンのOCR精度を劇的に向上させます。

Fix Image Orientation for Reading in .NET C# 以下の方法を学んでください。
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply Deskew filter
imageInput.Deskew();
C#
2

ローテート

OCRエンジンでテキストが正しく表示されるように、プログラムで画像を任意の角度で回転させます。

Fix Image Orientation for Reading in .NET C# 以下の方法を学んでください。
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Rotate the image 180 degrees clockwise
imageInput.Rotate(180);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
3

オリエンテーションの検出

ページの向き(0度、90度、180度、270度)を自動的に判断し、OCR前の向き補正に役立ちます。ドキュメントが上下逆さまにスキャンされた場合でも、高い精度を保証します。

ページの回転を検出する 方法を学んでください。
using IronOcr;

using var input = new OcrInput();

// Load PDF document
input.LoadPdf("Clockwise90.pdf");

// Detect page rotation
var results = input.DetectPageOrientation();

// Ouput result
foreach(var result in results)
{
    Console.WriteLine(result.PageNumber);
    Console.WriteLine(result.HighConfidence);
    Console.WriteLine(result.RotationAngle);
}
C#

Icon Main related to 前処理
入力解像度コントロール

1

規模

画像をOCRに最適な解像度にリサイズし、低解像度のソースファイルの精度を大幅に向上させます。

Fix Image Orientation for Reading in .NET C# 以下の方法を学んでください。
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply scale
imageInput.Scale(70);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
2

DPI設定

低解像度の画像や、メタデータが欠落しているスキャン画像には、DPI(Dots Per Inch)を手動で設定します。DPI値を提供することで、OCRエンジンがガイドされ、認識品質が大幅に向上します。

C# Tesseract Image DPI の方法を学んでください。
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.TargetDPI = 300;
ocrInput.LoadImage(@"images\image.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
3

解像度の向上

低解像度の画像の鮮明度と明瞭度をアルゴリズムで向上させ、ぼやけたりピクセル化した入力からテキストを救い出す。

次の方法を学んでください:読み取りフィルタを使用して画像を修正する
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply enhance resolution filter
imageInput.EnhanceResolution();

// Export filtered image
imageInput.SaveAsImages("sharpen.jpg");
C#
4

フィルターマジック

単一のインテリジェントなメソッドを使用して、一連の前処理フィルタを適用します。フィルタウィザードは、入力画像を自動的に分析し、最適な補正シーケンスを適用して、可能な限り最良のOCR結果を実現します。

フィルター ウィザード
using IronOcr;

var ocrTesseract = new IronTesseract();

// WIZARD - If you are unsure which filters to use,
// use the debug-wizard to test all combinations:
string codeToRun = OcrInputFilterWizard.Run(@"images\image.png", out double confidence, ocrTesseract);
Console.WriteLine($"Confidence: {confidence}");
Console.WriteLine(codeToRun);
C#
5

画像の領域をOCRする

テキストを含む画像の特定の領域だけをターゲットにすることで、処理時間を節約できます。矩形領域を定義するだけで、フォーム、テーブル、乱雑な背景からテキストを分離して抽出できます。

C#で画像の特定領域をOCRする 方法を学ぶ。
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var ContentArea = new Rectangle(x: 215, y: 1250, width: 1335, height: 280);
ocrInput.LoadImage("img/example.png", ContentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
準備はできましたか?
Nuget ダウンロード 5,167,857 | Version: 2025.11 リリース