IRONOCRの使用

C#でOCRソフトウェアのデモを作成する方法

公開済み 2024年6月6日
共有:

光学文字認識 (OCR)(OCR (光学式文字認識))は、スキャンされた紙のドキュメント、PDF、デジタルファイル、またはデジタルカメラで撮影された印刷されたテキストの画像を含むさまざまなドキュメント形式を、編集可能で検索可能な機械にエンコードされたテキストデータに変換する技術です。

IronOCRは、開発者に強力なOCR機能を提供する優れたOCRエンジンライブラリです。 この記事では、OCRソフトウェアデモを使用してコード例とともにIronOCRを用いたOCRの実行方法を探ります。

IronOCRとは何ですか?

IronOCRは、光学式文字認識を容易にするために設計された強力な.NETライブラリです。(OCR (光学式文字認識))C#およびVB.NETアプリケーション内で。 高度なアルゴリズムと機械学習技術を活用して、IronOCRはスキャンされたPDFファイル、画像、およびPDFから正確にテキストとコンテンツを抽出でき、プログラム上でそれらのファイルを処理、検索、解析することが容易になります。

わかりやすいAPIと充実した機能を備えており、開発者はOCR機能をアプリケーションにシームレスに統合して、データ抽出、ドキュメント処理、データ入力、コンテンツ管理作業を自動化することができます。 ビジネスで請求書、レポート、データの自動抽出、検索可能なPDF、その他の文字ベースの文書を扱っている場合、IronOCR はOCRの要件を効率的に処理するための信頼できるソリューションを提供します。

IronOCRの使い始め方

コード例に入る前に、インストールする必要がありますNuGetパッケージマネージャー経由のIronOCR. 次のコマンドをパッケージマネージャーコンソールで実行することでIronOCRをインストールできます:

Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
VB   C#

IronOCRを使用したOCRの実行

基本的なテキスト認識

IronOCRを使用して基本的なテキスト認識を実行するには、以下のコードスニペットを使用できます:

using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
	Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
	Dim RecognizedText As String = ocrResult.Text
	Console.WriteLine(RecognizedText)
End Using
VB   C#

このコードはIronOCRを使用して光学文字認識を実行します(OCR (光学式文字認識))画像ファイル名「ocr.png」上に。 アイアンテセラクトオブジェクトを初期化して、画像ファイルのテキスト層をOcrInputオブジェクトに読み込みます。

OCRの結果はRecognizedTextとして取得され、コンソールに出力されます。

出力

cs

 - ロゴショップ

 - ローレム・イプサム

 - ドロール シタメット コンセクテトル

 - エリート
  • 1 LOREM IPSUM $3.20

    • ORNE 2点、マレースーダ $9.50

    • 3 ポルタ・フェルメンタム $5.90

    • 4 ソダレス アルク $6.00

    • 5エレイフェンド $9.00

    • 6 SEMNISIMASSA $0.50

6 SEMNISIMASSA ¥50

 - 7 DUIS FAMES DIS $7.60

 - 8ファシリシリス $810

 - 合計金額 $49.80

 - 現金 $50.00

もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。

高度なOCRオプション

IronOCRは、画像ファイルと要件に応じてOCRプロセスをカスタマイズするためのさまざまなオプションを提供します。 例えば、OCR 言語を指定したり、画像の事前処理設定を調整したり、テキストクリーニングを有効にしたりできます。 ここにこれらの高度なオプションのいくつかを示す例があります:

using IronOcr;
class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
    ocrInput.LoadImage(@"images\image.png");
        // Set OCR language to English
        ocr.Language = OcrLanguage.English;
        // Enable text cleaning
        ocrInput.DeNoise();
    ocrInput.EnhanceResolution(225);
        var result = ocr.Read(ocrInput);
        if (result != null && result.Text != null)
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
using IronOcr;
class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
    ocrInput.LoadImage(@"images\image.png");
        // Set OCR language to English
        ocr.Language = OcrLanguage.English;
        // Enable text cleaning
        ocrInput.DeNoise();
    ocrInput.EnhanceResolution(225);
        var result = ocr.Read(ocrInput);
        if (result != null && result.Text != null)
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
Imports IronOcr
Friend Class Program
	Shared Sub Main()
		Dim ocr = New IronTesseract()
		Dim ocrInput As New OcrInput()
	ocrInput.LoadImage("images\image.png")
		' Set OCR language to English
		ocr.Language = OcrLanguage.English
		' Enable text cleaning
		ocrInput.DeNoise()
	ocrInput.EnhanceResolution(225)
		Dim result = ocr.Read(ocrInput)
		If result IsNot Nothing AndAlso result.Text IsNot Nothing Then
			Console.WriteLine($"Recognized Text: {result.Text}")
		End If
	End Sub
End Class
VB   C#

コードはIronOCRを使用して、「images」フォルダにある画像ファイル「image.png」に対してOCR(光学文字認識)を実行します。 OCR言語を英語に設定し、画像ノイズを除去し、解像度を向上させます。 画像から認識されたテキストが抽出され、コンソールに出力されます。

C#でOCRソフトウェアデモを作成する方法:図1

バーコード読み取り

IronOCRは、バーコードの読み取りもサポートしており、画像からバーコード情報を抽出するソフトウェアを作成することができます。 以下は、IronOCRを使用してバーコードを読み取る方法を示すコード例です:

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\imageWithBarcode.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
	Console.WriteLine(barcode.Value)
Next barcode
VB   C#

コードはIronOCRを使用して、「images」フォルダ内の画像ファイル「imageWithBarcode.png」からバーコードを検出して読み取ります。 ReadBarCodes をtrueに設定することで、IronOCRがバーコード読み取りを有効にします。 検出されたバーコードの値は、その後コンソールに出力されます。

C#でOCRソフトウェアのデモを作成する方法: 図2

PDFテキスト抽出

IronOCRは、PDFやスキャンされたドキュメントからテキストを抽出することもできます。 以下は、IronOCRを使用してPDFファイルからテキストを抽出する方法を示すコード例です:

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
' OCR entire document
ocrInput.LoadPdf("Email_Report.pdf")
Dim pages() As Integer = { 1, 2, 3, 4, 5 }
' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
VB   C#

コードはIronOCRを使用して、"Email_Report.pdf"という名前のPDFドキュメントに対してOCR処理を行います。 ドキュメント全体をLoadPdfを使用してOCRすることも、パスワードを使用してLoadPdfPagesで「example.pdf」の特定のページをOCRすることもできます。 OCR操作で認識されたテキストはコンソールに印刷されます。

C#でOCRソフトウェアデモを作成する方法:図3

結論

IronOCRは、強力な.NETライブラリで、先進的なOCRソフトウェア機能を提供し、開発者が自分のアプリケーションでOCRタスクを簡単に実行できるようにします。 この記事では、コード例を使用してIronOCRを使った基本および高度なOCRソフトウェアデモの実行方法について探求しました。

手書きのテキストを認識する場合でも、さまざまなデジタル形式を読み取る場合、バーコードをスキャンして読み取る場合、またはPDFドキュメントからテキストを抽出する場合でも、IronOCRは包括的な機能セットで対応します。

.NETプロジェクトに取り組んでいてOCR機能を統合する必要がある場合、さまざまなOCRエンジンを検討する際にIronOCRを是非考慮すべきです。 その使いやすさ、スピード、柔軟性、そして豊富なドキュメントにより、OCR自動化タスクにおける開発者の間で人気の選択肢となっています。

鉄OCRを試してみて、自分のOCRプロジェクト開発プロセスをどれだけ簡素化できるか確認してみませんか? それはあなたのプロジェクトにとって最適なOCRエンジンかもしれません。

IronOCRは無料の試用ライセンスその後、$749 USDから始まり、あなたのプロジェクトでIronOCRを最大限に活用し続けることができます。

IronOCRについての詳細は、こちらをご覧くださいこれ.

< 以前
Tesseract OCR 多言語対応(開発者向けチュートリアル)
次へ >
C#で車両登録のOCRを実行する方法