透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
光学式文字認識 (OCR) は、スキャンした紙の文書、PDF、デジタルファイル、またはデジタルカメラで撮影した印刷テキストの画像など、さまざまな文書フォーマットを、編集可能で検索可能な機械エンコードされたテキストデータに変換する技術です。
IronOCRは、開発者に強力なOCR機能を提供する優れたOCRエンジンライブラリです。 この記事では、OCR Software Demoを用いたコード例でIronOCRを使用してOCRを実行する方法を探求します。
IronOCRは、C#およびVB.NETアプリケーション内で光学式文字認識(OCR)を容易にするために設計された強力な.NETライブラリです。 高度なアルゴリズムと機械学習技術を活用して、IronOCRはスキャンされたPDFファイル、画像、およびPDFから正確にテキストとコンテンツを抽出でき、プログラム上でそれらのファイルを処理、検索、解析することが容易になります。
わかりやすいAPIと充実した機能を備えており、開発者はOCR機能をアプリケーションにシームレスに統合して、データ抽出、ドキュメント処理、データ入力、コンテンツ管理作業を自動化することができます。 ビジネスで請求書、レポート、データの自動抽出、検索可能なPDF、その他の文字ベースの文書を扱っている場合、IronOCR はOCRの要件を効率的に処理するための信頼できるソリューションを提供します。
コード例に入る前に、NuGet パッケージ マネージャーを介して IronOCR をインストールする必要があります。 次のコマンドをパッケージマネージャーコンソールで実行することでIronOCRをインストールできます:
Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
IronOCRを使用して基本的なテキスト認識を実行するには、以下のコードスニペットを使用できます:
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
Dim RecognizedText As String = ocrResult.Text
Console.WriteLine(RecognizedText)
End Using
このコードは、IronOCRを使用して、「ocr.png」という名前の画像ファイルに対して光学文字認識(OCR)を実行します。 それはIronTesseractオブジェクトを初期化し、画像ファイルのテキストレイヤーをOcrInputオブジェクトに読み込みます。
OCR結果はRecognizedTextとして取得され、コンソールに出力されます。
ロゴショップ - LOREM IPSUM - ドロール シタメ トコンセクテトゥール - ADIPISCING ELIT - 1 LOREM IPSUM $3.20 - 2 ORNARE MALESUADA $9.50 - 3 ポルタフェルメンタム $5.90 - 4 ソダレス アルク $6.00 - 5 ELEIFEND $9.00 - 6 SEMNISIMASSA $0.50 - 7 DUIS FAMES DIS $7.60 - 8 FACILISIRISUS $810 - 総額 $49.80 現金 $50.00
ロゴショップ - LOREM IPSUM - ドロール シタメ トコンセクテトゥール - ADIPISCING ELIT - 1 LOREM IPSUM $3.20 - 2 ORNARE MALESUADA $9.50 - 3 ポルタフェルメンタム $5.90 - 4 ソダレス アルク $6.00 - 5 ELEIFEND $9.00 - 6 SEMNISIMASSA $0.50 - 7 DUIS FAMES DIS $7.60 - 8 FACILISIRISUS $810 - 総額 $49.80 現金 $50.00
'INSTANT VB TODO TASK: The following line uses invalid syntax: 'ロゴショップ - LOREM IPSUM - ドロール シタメ トコンセクテトゥール - ADIPISCING ELIT - 1 LOREM IPSUM $3.20 - 2 ORNARE MALESUADA $9.50 - 3 ポルタフェルメンタム $5.90 - 4 ソダレス アルク $6.00 - 5 ELEIFEND $9.00 - 6 SEMNISIMASSA $0.50 - 7 DUIS FAMES DIS $7.60 - 8 FACILISIRISUS $810 - 総額 $49.80 現金 $50.00
$vbLabelText $csharpLabel
### 高度なOCRオプション
IronOCRは、画像ファイルと要件に応じてOCRプロセスをカスタマイズするためのさまざまなオプションを提供します。 例えば、OCR 言語を指定したり、画像の事前処理設定を調整したり、テキストクリーニングを有効にしたりできます。 ここにこれらの高度なオプションのいくつかを示す例があります:
```cs
using IronOcr;
class Program
{
static void Main()
{
var ocr = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\image.png");
// Set OCR language to English
ocr.Language = OcrLanguage.English;
// Enable text cleaning
ocrInput.DeNoise();
ocrInput.EnhanceResolution(225);
var result = ocr.Read(ocrInput);
if (result != null && result.Text != null)
{
Console.WriteLine($"Recognized Text: {result.Text}");
}
}
}
コードはIronOCRを使用して、「images」フォルダにある画像ファイル「image.png」に対してOCR(光学文字認識)を実行します。 OCR言語を英語に設定し、画像ノイズを除去し、解像度を向上させます。 画像から認識されたテキストが抽出され、コンソールに出力されます。
IronOCRは、バーコードの読み取りもサポートしており、画像からバーコード情報を抽出するソフトウェアを作成することができます。 以下は、IronOCRを使用してバーコードを読み取る方法を示すコード例です:
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\imageWithBarcode.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
Console.WriteLine(barcode.Value)
Next barcode
コードはIronOCRを使用して、「images」フォルダ内の画像ファイル「imageWithBarcode.png」からバーコードを検出して読み取ります。 これはReadBarCodesをtrueに設定することでIronOCRを構成し、バーコード読み取りを有効にします。 検出されたバーコードの値は、その後コンソールに出力されます。
IronOCRは、PDFやスキャンされたドキュメントからテキストを抽出することもできます。 以下は、IronOCRを使用してPDFファイルからテキストを抽出する方法を示すコード例です:
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
' OCR entire document
ocrInput.LoadPdf("Email_Report.pdf")
Dim pages() As Integer = { 1, 2, 3, 4, 5 }
' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
コードはIronOCRを使用して、"Email_Report.pdf"という名前のPDFドキュメントに対してOCR処理を行います。 LoadPdfを使用して文書全体をOCRすることができます。また、LoadPdfPagesを使用して、"example.pdf"から特定のページをパスワード付きでOCRすることもできます。 OCR操作で認識されたテキストはコンソールに印刷されます。
IronOCR は強力な .NET ライブラリであり、先進的な OCR ソフトウェア機能を提供し、開発者がアプリケーションで OCR タスクを簡単に実行できるようにします。 この記事では、コード例を使用してIronOCRを使った基本および高度なOCRソフトウェアデモの実行方法について探求しました。
.NETプロジェクトに取り組んでいてOCR機能を統合する必要がある場合、さまざまなOCRエンジンを検討する際にIronOCRを是非考慮すべきです。 その使いやすさ、スピード、柔軟性、そして豊富なドキュメントにより、OCR自動化タスクにおける開発者の間で人気の選択肢となっています。
鉄OCRを試してみて、自分のOCRプロジェクト開発プロセスをどれだけ簡素化できるか確認してみませんか? それはあなたのプロジェクトにとって最適なOCRエンジンかもしれません。
IronOCRは、無料のトライアルライセンスを提供しており、その後、あなたのプロジェクトでIronOCRを最大限に活用するために、$749 USDから開始します。
IronOCRについて詳しく知るにはこちらをご覧ください。