フッターコンテンツにスキップ
IRONOCRの使い方

C#でOCRソフトウェアデモを作成する方法

光学式文字認識(OCR)は、スキャンした紙文書、PDF、デジタルファイル、デジタルカメラで撮影した印刷テキストの画像など、さまざまな文書形式を編集可能で検索可能な機械エンコードされたテキストデータに変換する技術です。

IronOCRは、開発者に強力なOCR機能を提供する優れたOCRエンジンライブラリです。 この記事では、OCRソフトウェアデモを使って、コード例とともにIronOCRを使ってOCRを実行する方法を探ります。

IronOCRとは何ですか?

IronOCRはC#およびVB.NETアプリケーション内で光学式文字認識(OCR)を容易にするために設計された強力な.NETライブラリです。 高度なアルゴリズムと機械学習技術を活用し、IronOCRはスキャンしたPDFファイル、画像、PDFからテキストとコンテンツを正確に抽出し、プログラムによるファイルの処理、検索、分析を容易にします。

分かりやすいAPIと豊富な機能により、開発者はOCR機能をアプリケーションにシームレスに統合し、データ抽出、文書処理、データ入力、コンテンツ管理作業を自動化することができます。 請求書、報告書、自動データ抽出、検索可能なPDF、その他テキストリッチな文書など、どのような業務であっても、IronOCRはOCR要件を効率的に処理する信頼できるソリューションを提供します。

IronOCRを使い始める

</h3

コード例に入る前に、NuGet Package Manager経由でIronOCRをインストールする必要があります。 IronOCRはパッケージマネージャーコンソールで以下のコマンドを実行することでインストールできます:

Install-Package IronOcr

IronOCRでOCRを実行する

</p

基本的なテキスト認識

IronOCRを使って基本的なテキスト認識を行うには、以下のコード・スニペットを使うことができます:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		Using ocrInput As New OcrInput("ocr.png")
			Dim ocrResult = ocrTesseract.Read(ocrInput)
			Dim recognizedText As String = ocrResult.Text
			Console.WriteLine(recognizedText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

このコードは "ocr.png "という名前の画像ファイルに対して光学式文字認識(OCR)を実行するためにIronOCRを使用しています。 IronTesseractオブジェクトを初期化し、画像ファイルのテキストレイヤーをOcrInputオブジェクトに読み込みます。

OCRの結果は、recognizedTextとして取得され、コンソールに出力されます。

アウトプット
- LOGO SHOP
- LOREM IPSUM
- DOLOR SITAMET CONSECTETUR
- ADIPISCING ELIT
- 1 LOREM IPSUM $3.20
- 2 ORNARE MALESUADA $9.50
- 3 PORTA FERMENTUM $5.90
- 4 SODALES ARCU $6.00
- 5 ELEIFEND $9.00
- 6 SEMNISIMASSA $0.50
- 7 DUIS FAMES DIS $7.60
- 8 FACILISIRISUS $810
- TOTAL AMOUNT $49.80
- CASH $50.00

高度な OCR オプション

C#でOCRソフトウェア・デモを作成する方法:図1C#でOCRソフトウェア・デモを作成する方法:図2C#でOCRソフトウェア・デモを作成する方法:図3

よくある質問

どうやってC#でOCRを実行できるのですか?

C#でOCRを実行するには、IronOCRライブラリを使用します。まず、NuGetパッケージマネージャーを介して Install-Package IronOcr コマンドでインストールします。その後、IronTesseractオブジェクトを使用して画像やPDFからテキストを読み取り、それを編集可能なテキストに変換します。

C#を使用して画像からテキストを抽出するためには、どのような手順が必要ですか?

C#で画像からテキストを抽出するには、IronTesseractオブジェクトのインスタンスを作成してIronOCRを使用します。'ocr.png'のような画像をロードし、Read()メソッドを呼び出して画像を処理し、テキストを抽出します。

IronOCRでOCRプロセスをカスタマイズできますか?

はい、IronOCRでは、OCR言語の設定、ノイズリダクション用の画像前処理の有効化、解像度の調整などのオプションを設定することで、OCRプロセスをカスタマイズすることができます。

IronOCRでバーコード読み取りを行うことは可能ですか?

はい、IronOCRはバーコードの読み取りをサポートしています。OCRセットアップ内でバーコード読み取り機能を有効にして、画像からバーコード情報を検出および抽出するように設定できます。

C# を使用して PDF からテキストを抽出するにはどうすればよいですか?

IronOCRを使用すると、C#でPDFファイルからテキストを抽出できます。PDF全体をOCRをかけるか、特定のページを選択してIronTesseractに読み込み、そのRead()メソッドを使用してテキストを抽出することができます。

IronOCRが開発者に推奨される理由は何ですか?

IronOCRはその包括的なOCR機能、使いやすさ、迅速な処理、および柔軟性から開発者に推奨されています。.NETプロジェクトにシームレスに統合され、OCRタスクの効率的な自動化を可能にします。

IronOCRにライセンスオプションはありますか?

IronOCRは、フリートライアルから始まるさまざまなライセンスオプションを提供しています。開発者は、自分のアプリケーションでIronOCRの完全な機能を継続して使用するために、異なるライセンスから選択することができます。

IronOCRの使用例コードはどこで見つけることができますか?

'OCR Software Demo in C# (Developer Tutorial)'という記事で、IronOCRを使用するためのコード例を見つけることができます。基本的なテキスト認識、高度なOCRオプション、およびバーコード読み取りの例が示されています。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。