IronOCRフィルター使用ガイド

チャクニット・ビン

2022年6月9日

更新済み 2024年12月10日

共有:

Translated

View the article in English

IronOCRは、フィルターという前処理が必要な画像を読み取るために必要なツールを備えています。画像を加工できるように、幅広いフィルターから選ぶことができる。

IronOCRを始めましょう

今日から無料トライアルでIronOCRをあなたのプロジェクトで使い始めましょう。

最初のステップ:

OCR画像フィルターのリスト

次のようなイメージフィルターを使用すると、パフォーマンスを向上させることができます：

画像の向きを変更するフィルター
- 回転 - 画像を時計回りに指定した度数だけ回転させます。反時計回りの場合は負の数を使用してください。
- 傾き補正 - 画像を回転させて正しい向きにし、直交させます。これは非常に有用です。なぜなら、Tesseractのスキャンの歪みに対する許容度が5度程度と低いからです。
スケール - OCR入力ページを比例的にスケールします。
イメージカラーを操作するフィルター
- 二値化 - この画像フィルターは、すべてのピクセルを黒または白に変換し、中間色を含みません。 OCRのパフォーマンスをテキストと背景のコントラストが非常に低い場合に改善する可能性があります。
- ToGrayScale - このイメージフィルターは、すべてのピクセルをグレースケールの色調に変換します。 OCRの精度を向上させる可能性は低いが、速度の向上は期待できる。
- 反転 - すべての色を反転します。例えば、白が黒になります：黒が白になります。
ReplaceColor - 画像内の色を特定のしきい値で別の色に置き換えます。
画像のコントラストを改善するためのフィルター
- コントラスト - 自動的にコントラストを増加させます。このフィルターは、低コントラストのスキャンにおいて、OCRの速度と精度を向上させることがよくあります。
- ディレート - 高度な形態学。 _Dilation_は、画像内のオブジェクトの境界にピクセルを追加します。「Erode」の反対語
エロード - 高度な形態学。エロージョンはオブジェクトの境界上のピクセルを削除します。拡大の反対
画像ノイズを低減するためのフィルター
- シャープ - ぼやけたOCRドキュメントをシャープにし、アルファチャネルを白にします。
- DeNoise - デジタルノイズを除去します。このフィルターはノイズが予想される場合にのみ使用するべきです。
- DeepCleanBackgroundNoise - 重度のバックグラウンドノイズ除去。このフィルタは、きれいな文書のOCR精度を低下させる危険性があり、CPUコストが非常に高いため、極端な文書背景ノイズがわかっている場合にのみ使用してください。
- EnhanceResolution - 低品質な画像の解像度を向上させます。なぜなら、_OcrInput.MinimumDPI_と_OcrInput.TargetDPI_が自動的に低解像度の入力を捕捉し、解決するからである。

フィルターの例と使い方

次の例では、コード内でフィルタを適用する方法を示します。

:path=/static-assets/ocr/content-code-examples/tutorials/c-sharp-ocr-image-filters-1.cs

using IronOcr;
using System;

var ocr = new IronTesseract();
using var input = new OcrInput();
input.LoadImage("my_image.png");
input.Deskew();

var result = ocr.Read(input);
Console.WriteLine(result.Text);

Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Private input = New OcrInput()
input.LoadImage("my_image.png")
input.Deskew()

Dim result = ocr.Read(input)
Console.WriteLine(result.Text)

$vbLabelText $csharpLabel

デバッグ・フィルター / フィルターは何をしているのか？

プログラム内で画像やバーコードの読み取りに問題がある場合。プログラム内でフィルター結果の画像を保存する方法があります。こうすることで、各フィルターが何を行い、どのように画像を操作しているかを正確にデバッグして確認することができます。

:path=/static-assets/ocr/content-code-examples/tutorials/c-sharp-ocr-image-filters-2.cs

using IronOcr;
using System;

var file = "skewed_image.tiff";
var ocr = new IronTesseract();
using var input = new OcrInput();
var pageindices = new int[] { 1, 2 };
input.LoadImageFrames(file, pageindices);
// Here we apply the filter: Deskew
input.Deskew();

// Save the input with filter(s) applied
input.SaveAsImages("my_deskewed");

// We read, then print the text to the console
var result = ocr.Read(input);
Console.WriteLine(result.Text);

Imports IronOcr
Imports System

Private file = "skewed_image.tiff"
Private ocr = New IronTesseract()
Private input = New OcrInput()
Private pageindices = New Integer() { 1, 2 }
input.LoadImageFrames(file, pageindices)
' Here we apply the filter: Deskew
input.Deskew()

' Save the input with filter(s) applied
input.SaveAsImages("my_deskewed")

' We read, then print the text to the console
Dim result = ocr.Read(input)
Console.WriteLine(result.Text)

$vbLabelText $csharpLabel

フィルター使用例

回転

API リファレンス

フィルターの説明

回転... は画像に既知の回転を手動で設定し、最も直線に近くするためのフィルターです。 IronOCRにはDeskew()を実行する機能がありますが、これの許容範囲はかなり狭く、ほぼ完全にまっすぐな（15度以内程度）画像に最適です。入力画像が90度ずれている場合や、逆さまの場合は、Rotate()を呼び出すべきです。

ユースケース・コードの例

これは、逆さまの画像を修正するためにRotateを呼び出した例である：

:path=/static-assets/ocr/content-code-examples/tutorials/c-sharp-ocr-image-filters-3.cs

using IronOcr;
using System;

var image = "screenshot.png";
var ocr = new IronTesseract();
using var input = new OcrInput();
// Load at least one image
input.LoadImage(image);

// Rotate 180 degrees because image is upside-down
input.Rotate(180);

// Read image into variable: result
var result = ocr.Read(input);

// Example print to console
Console.WriteLine(result.Text);

Imports IronOcr
Imports System

Private image = "screenshot.png"
Private ocr = New IronTesseract()
Private input = New OcrInput()
' Load at least one image
input.LoadImage(image)

' Rotate 180 degrees because image is upside-down
input.Rotate(180)

' Read image into variable: result
Dim result = ocr.Read(input)

' Example print to console
Console.WriteLine(result.Text)

$vbLabelText $csharpLabel

Input.Rotate(180)の前 Input.Rotate(180)の後

Screenshot related to ユースケース・コードの例 Screenshot Rotated related to ユースケース・コードの例

傾き補正

APIリファレンス

フィルターの説明

ハフ変換を使って、ある許容範囲内で画像をまっすぐにしようとする。文書が傾いていると誤読の原因になることがあるからだ。

*注意: このメソッドは、フィルターが適用された場合はtrueを、画像の向きを検出できなかったために適用に失敗した場合はfalseを返すブール値を返します。ページがオリエンテーションのベースとなるコンテンツを持っていない場合、これは失敗する。

ユースケース・コードの例

これは、傾いた画像を補正するためにDeskewを呼び出した例である：

:path=/static-assets/ocr/content-code-examples/tutorials/c-sharp-ocr-image-filters-4.cs

using IronOcr;
using System;

var image = @"paragraph_skewed.png";
var ocr = new IronTesseract();
using var input = new OcrInput();
// Load at least one image
input.LoadImage(image);

// Apply deskew with 15 degree snap
bool didDeskew = input.Deskew(15);
if (didDeskew)
{
    // Read image into variable: result
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
else
{
    Console.WriteLine("Deskew not applied because Image Orientation could not be determined.");
}

Imports IronOcr
Imports System

Private image = "paragraph_skewed.png"
Private ocr = New IronTesseract()
Private input = New OcrInput()
' Load at least one image
input.LoadImage(image)

' Apply deskew with 15 degree snap
Dim didDeskew As Boolean = input.Deskew(15)
If didDeskew Then
	' Read image into variable: result
	Dim result = ocr.Read(input)
	Console.WriteLine(result.Text)
Else
	Console.WriteLine("Deskew not applied because Image Orientation could not be determined.")
End If

$vbLabelText $csharpLabel

Deskew()の前に After Deskew()

Paragraph Skewed related to ユースケース・コードの例 Paragraph Deskewed related to ユースケース・コードの例

スケール

API リファレンス

フィルターの説明

拡大縮小は便利な画像加工フィルターで、画像がすでに持っている画素数で画像サイズを変更するのに役立ちます。これは、画像が数十ピクセル幅しかなく、各バーが1ピクセルであるためにバーコードがスキャンされない場合や、アンチエイリアシングがなくテキストが小さすぎる場合に使用できる。

注意: バーコードのサイズには1000px x 1000pxという最適な範囲があり、バーコードを見つけることができない場合には考慮する必要があります。

ユースケース・コードの例

これは、スキャンのためにバーコードのバー間のギャップを拡大するためにScaleを呼び出す例です：

:path=/static-assets/ocr/content-code-examples/tutorials/c-sharp-ocr-image-filters-5.cs

using IronOcr;
using System;

var image = @"small_barcode.png";
var ocr = new IronTesseract();

// Optional: This example uses a barcode
ocr.Configuration.ReadBarCodes = true;

using var input = new OcrInput();
// Load at least one image
input.LoadImage(image);

// Apply scale
input.Scale(400); // 400% is 4 times larger

// Read image into variable: result
var result = ocr.Read(input);

// Example print to console
Console.WriteLine(result.Text);

Imports IronOcr
Imports System

Private image = "small_barcode.png"
Private ocr = New IronTesseract()

' Optional: This example uses a barcode
ocr.Configuration.ReadBarCodes = True

Dim input = New OcrInput()
' Load at least one image
input.LoadImage(image)

' Apply scale
input.Scale(400) ' 400% is 4 times larger

' Read image into variable: result
Dim result = ocr.Read(input)

' Example print to console
Console.WriteLine(result.Text)

$vbLabelText $csharpLabel

Scale()の前 Scale()の後

C Sharp Ocr Image Filters 1 related to ユースケース・コードの例 C Sharp Ocr Image Filters 2 related to ユースケース・コードの例

2値化

APIリファレンス

フィルターの説明

Binarizeフィルタは、画像と背景と思われる色を評価する適応的アルゴリズムによって、画像内のすべてのピクセルを黒か白のいずれかに分類します。色数の多い画像で、文字が目立つような場合、二値化フィルタはすべての色を除去して背景を真っ白に分離し、文字として認識されるものは読みやすいように真っ黒に着色する。

ユースケース・コードの例

これは、Binarizeを呼び出して色つきテキストを整列させ、背景色とノイズを除去した例である：

:path=/static-assets/ocr/content-code-examples/tutorials/c-sharp-ocr-image-filters-6.cs

using IronOcr;
using System;

var image = @"no-binarize.jpg";
var ocr = new IronTesseract();

using var input = new OcrInput();
// Load at least one image
input.LoadImage(image);

// Apply Binarize
input.Binarize();

// Read image into variable: result
var result = ocr.Read(input);

// Example print to console
Console.WriteLine(result.Text);

Imports IronOcr
Imports System

Private image = "no-binarize.jpg"
Private ocr = New IronTesseract()

Private input = New OcrInput()
' Load at least one image
input.LoadImage(image)

' Apply Binarize
input.Binarize()

' Read image into variable: result
Dim result = ocr.Read(input)

' Example print to console
Console.WriteLine(result.Text)

$vbLabelText $csharpLabel

Binarize()の前 Binarize()の後

No Binarize related to ユースケース・コードの例 After Binarize related to ユースケース・コードの例

反転

APIリファレンス

フィルターの説明

IronOCRは、画像読取が白い背景に黒い文字の場合に最適に読み取ります。一連のフィルターを適用する場合、読み出しの前にこの結果を達成しようとすることが重要である。反転... フィルターは画像のすべての色を反転させるシンプルなフィルターです。白が黒になり、黒が白になり、その間のすべてが反転する。

ユースケース・コードの例

これは、黒地に白を白地に黒にするためにInvertを呼び出した例である：

:path=/static-assets/ocr/content-code-examples/tutorials/c-sharp-ocr-image-filters-7.cs

using IronOcr;
using System;

var image = @"before-invert.png";
var ocr = new IronTesseract();

using var input = new OcrInput();
// Load at least one image
input.LoadImage(image);

// Apply Invert
input.Invert(true);

// Read image into variable: result
var result = ocr.Read(input);

// Example print to console
Console.WriteLine(result.Text);

Imports IronOcr
Imports System

Private image = "before-invert.png"
Private ocr = New IronTesseract()

Private input = New OcrInput()
' Load at least one image
input.LoadImage(image)

' Apply Invert
input.Invert(True)

' Read image into variable: result
Dim result = ocr.Read(input)

' Example print to console
Console.WriteLine(result.Text)

$vbLabelText $csharpLabel

前後

Before Invert related to ユースケース・コードの例 After Invert related to ユースケース・コードの例