ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
IronOCR 画像から情報抽出のためにテキストデータを認識するために使用できるOCRライブラリで、レシートOCRを含みます。 それは、レシート認識に関してこれまでで最も正確なOCRエンジンの一つとされるTesseract OCRエンジンの上に構築されています。 IronOCRは、PNG、JPG、TIFF、JSON形式、およびPDFなどのさまざまなドキュメントタイプから重要な情報を読み取るために使用でき、複数の言語でテキストを認識できます。
IronOCRの領収書OCRに特に有用な主要な機能やサービスの一つは、その能力です。 テキストの向きを自動的に検出画像が回転または歪んでいても。 これが正確なテキスト認識にとって不可欠です。レシートのアップロードとデータ抽出の際、レシートには多くの情報が含まれ、折りたたまれたり、シワが寄ったりすることがあり、テキストが歪む可能性があるためです。
Visual Studioソフトウェアを開き、[ファイル]メニューに移動します。 「新しいプロジェクト」を選択し、その後に「コンソールアプリケーション」を選択します。
プロジェクト名を入力し、適切なテキストボックスでパスを選択してください。 次に、「Create」ボタンをクリックします。 以下のスクリーンショットのように、必要な .NET フレームワークを選択してください。
Visual Studio で新しいプロジェクトを作成する
Visual Studio プロジェクトは、コンソール アプリケーションの構造を生成します。 完了すると、Program.csファイルが開きます。このファイルでソースコードを記述および実行できます。
Visual Studioの新しいプロジェクトウィザードから生成されたprogram.csファイル
Visual Studioでは、C#プロジェクトにIronOCRを簡単に統合することができます。 IronOCRはC# .NETプロジェクトに統合するための複数の方法を提供しています。 ここでは、そのうちの1つを取り上げます:NuGetパッケージマネージャーを使用してIronOCRをインストールする方法について。
Visual Studioで、ツール > NuGetパッケージマネージャー > パッケージマネージャーコンソール に移動します
Visual Studio NuGet パッケージ マネージャー コンソール
クリックすると、Visual Studioのウィンドウの下に新しいコンソールが表示されます。 コンソールに以下のコマンドを入力し、Enterキーを押してください。
Install-Package IronOcr
IronOCRは数秒でインストールされます。
IronOCRは、レシートから詳細までのデータを抽出してアクセスするために使用できる強力なOCRライブラリです。IronOCRを使用すると、レシートの写真を撮り、それを機械可読なテキストに変換して、データプライバシーを損なうことなく簡単に分析および処理することができます。
以下は、IronOCRを使用してレシートからテキストを抽出し、レシートOCRの動作を示す方法の例です。
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
Dim RecognizedText As String = ocrResult.Text
Console.WriteLine(RecognizedText)
End Using
情報文を日本語に翻訳しますね:
以下をご参照ください 画像からテキストを読み取るチュートリアル C#コンピュータ言語を使用してIronOCRが画像からテキストを読み取る方法の詳細については、こちらをご覧ください。
上記のコードの出力は以下の通りです:
- LOGO SHOP
- LOREM IPSUM
- DOLOR SITAMET CONSECTETUR
- ADIPISCING ELIT
- 1 LOREM IPSUM $3.20
- 2 ORNARE MALESUADA $9.50
- 3 PORTA FERMENTUM $5.90
- 4 SODALES ARCU $6.00
- 5 ELEIFEND $9.00
- 6 SEMNISIMASSA $0.50
- 7 DUIS FAMES DIS $7.60
- 8 FACILISIRISUS $810
- TOTAL AMOUNT $49.80
- CASH $50.00
強力なOCRライブラリであるIronOCRは、開発者がスキャンされたレシートから税額や販売者名などの重要な情報を取得することを可能にします。
以下は、領収書の画像から合計金額を抽出するためにIronOCRを使用する方法の例です:
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
ocrTesseract.Language = OcrLanguage.English;
// Code line to load the receipt image
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
// Optimize the input image for OCR
ocrInput.DeNoise(true);
ocrInput.Contrast();
ocrInput.EnhanceResolution();
ocrInput.ToGrayScale();
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Search for the total price in the OCR result
var totalPrice = ocrResult.Text.Contains("Total:") ? ocrResult.Text.Split("Total:")[1].Split("\n")[0] : "";
Console.WriteLine("Total Price: " + totalPrice);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
ocrTesseract.Language = OcrLanguage.English;
// Code line to load the receipt image
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
// Optimize the input image for OCR
ocrInput.DeNoise(true);
ocrInput.Contrast();
ocrInput.EnhanceResolution();
ocrInput.ToGrayScale();
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Search for the total price in the OCR result
var totalPrice = ocrResult.Text.Contains("Total:") ? ocrResult.Text.Split("Total:")[1].Split("\n")[0] : "";
Console.WriteLine("Total Price: " + totalPrice);
}
Imports Microsoft.VisualBasic
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
ocrTesseract.Language = OcrLanguage.English
' Code line to load the receipt image
Using ocrInput As New OcrInput("ocr.png")
' Optimize the input image for OCR
ocrInput.DeNoise(True)
ocrInput.Contrast()
ocrInput.EnhanceResolution()
ocrInput.ToGrayScale()
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
' Search for the total price in the OCR result
Dim totalPrice = If(ocrResult.Text.Contains("Total:"), ocrResult.Text.Split("Total:")(1).Split(vbLf)(0), "")
Console.WriteLine("Total Price: " & totalPrice)
End Using
以下の設定のおかげで OcrInput(OCR入力) クラスでは、OCRプロセスでより高い精度を得るために、入力画像を最適化することが可能です。
レシートから特定のデータを抽出するための入力画像
- Total 16.5
IronOCRは、テキストだけでなくレシート上のバーコードを読み取るためにも使用できます。 レシート上のバーコードをIronOCRで読み取るには、次のコードを使用する必要があります: BarcodeReader (バーコードリーダー) クラスと組み合わせて `ReadBarCodes (バーコードを読み取る)もちろん、英語のテキストを教えていただけますでしょうか? メソッド。
以下に、レシート画像上のバーコードを読み取るためにIronOCRを使用する方法の例を示します。
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("b.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("b.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Using ocrInput As New OcrInput("b.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
Console.WriteLine(barcode.Value)
Next barcode
End Using
バーコードの読み取り用入力
バーコード画像の処理結果
上記の記事では、領収書からデータを抽出するためにC#プロジェクトでIronOCRをインストールして使用する手順について説明しています。例としてコードスニペットも提供されています。
チュートリアルを読んでください 画像からテキストを読み取る.
IronOCRは Iron Suite、これは文書と画像を操作するための5つの異なる.NETライブラリを含みます。
あなたは Iron Suite 全体を購入する 2つの価格で IronOCRライセンス.
本番アプリケーションで IronOCR をお試しください。 無料試用.
9つの .NET API製品 オフィス文書用