ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
インボイスOCR APIは、機械学習とコンピュータビジョンを活用して、請求書データを自動処理に適した形式に変換します。 この技術は、遅延、コスト、およびエラーのような手動データ入力の問題に対処し、デジタルおよびスキャンされた請求書から、ベンダー情報、請求書番号、および価格といった詳細を正確に抽出します。
この記事では、最新の請求書OCR APIであるIronOCR.
OCR入力
メソッドOcr.Read
メソッド。Console.WriteLine
IronOCRは、Iron Softwareによって開発されたOCRライブラリで、開発者向けにさまざまなツールを提供しています。 スキャンしたドキュメント、画像、およびPDFからテキストを抽出するために、機械学習とコンピュータビジョンを使用し、自動処理を可能にします。 そのAPIはさまざまな言語やプラットフォームに統合され、手動でのデータ入力エラーを減少させ、効率を向上させます。 抽出されたデータは、意思決定および生産性を支援するために分析され、既存のシステムに統合することができます。 「Features like」は日本語に「以下のような機能」と翻訳できます。画像前処理, バーコード認識ファイル解析はその柔軟性を高めます。 IronOCRは、開発者がアプリケーションにテキスト認識機能を組み込むことを可能にします。
IronOCRを使用する前に、いくつかの前提条件を満たしている必要があります。 これらの前提条件には以下が含まれます:
コンピュータに適切な開発環境が設定されていることを確認してください。 これは通常、統合開発環境 (IDE) を持つことを伴います。(IDE (統合開発環境))Visual Studioがインストールされているなど。
C#プログラミング言語の基本的な理解を持つことが重要です。 この記事に提供されたコード例を効果的に理解して変更することができるようになります。
プロジェクトにIronOCRライブラリをインストールする必要があります。 これは、Visual Studio内のNuGetパッケージマネージャーを使用するか、またはコマンドラインインターフェイスを使用することで実現できます。
これらの前提条件が満たされていることを確認することで、IronOCRの使用に取り掛かる準備が整います。
IronOCRを始めるには、最初のステップとして新しいVisual Studioプロジェクトを作成します。
Visual Studio を開き、「ファイル」へ進み、「新規」をホバーして、「プロジェクト」をクリックします。
新しいプロジェクト
新しいウィンドウで、「コンソール アプリケーション」を選択し、「次へ」をクリックします。
コンソール アプリケーション
新しいウィンドウが表示されます。新しいプロジェクトの名前と場所を入力し、「次へ」をクリックしてください。
プロジェクト設定
最後に、ターゲットフレームワークを指定して、「作成」をクリックしてください。
ターゲットフレームワーク
新しいVisual Studioプロジェクトが作成されました。 IronOCRをインストールしましょう。
IronOCRライブラリをダウンロードおよびインストールするにはいくつかの方法があります。 しかし、こちらが2つの最も簡単なアプローチです。
Visual Studio NuGet パッケージ マネージャーを使用する
IronOCRは、Visual StudioのNuGetパッケージマネージャーを使用してC#プロジェクトに含めることができます。
ツール > NuGet パッケージ マネージャー > ソリューション用の NuGet パッケージの管理 を選択して、NuGet パッケージ マネージャーのグラフィカル ユーザー インターフェイスへ移動します。
NuGet パッケージ マネージャー
その後、新しいウィンドウが表示されます。 IronOCRを検索し、プロジェクトにパッケージをインストールします。
NuGet パッケージ マネージャー UI で IronOCR パッケージを選択
上記の方法を使用して、IronOCRの追加言語パックもインストールできます。
Visual Studioで、ツール > NuGetパッケージマネージャー > パッケージマネージャーコンソール に移動します
:ProductInstall
パッケージ マネージャー コンソール
パッケージが現在のプロジェクトにダウンロード/インストールされ、使用可能になります。
IronOCRを使用すると、数行のコードで簡単に請求書からデータを抽出し、そのデータ抽出をデータ入力などのさらなるプロセスに利用できます。 これにより、手動でのデータ入力やその他多くの作業が置き換えられます。
以下は、テキストを抽出するためのサンプル請求書です。
サンプル請求書
それでは、この請求書からすべてのデータを抽出するためのコードを書きましょう。
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput("r2.png")
Dim result = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
上記のコードは、画像として入力を受け取り、その画像からデータを抽出します。`読取 (読み取り)もちろん、英語のテキストを教えていただけますでしょうか?メソッドからのIronTesseract
クラス。
インボイスパーサー
請求書から顧客の請求書番号などの特定のデータを抽出することもできます。 以下は、請求書から顧客の請求書番号を抽出するコードです。
using IronOcr;
using System;
using System.Text.RegularExpressions;
var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = orc.Read(input);
var linePattern = @"INV\/\d{4}\/\d{5}";
var lineMatch = Regex.Match(result.Text, linePattern);
if (lineMatch.Success)
{
var lineValue = lineMatch.Value;
Console.WriteLine("Customer Invoice number: " + lineValue);
}
}
using IronOcr;
using System;
using System.Text.RegularExpressions;
var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = orc.Read(input);
var linePattern = @"INV\/\d{4}\/\d{5}";
var lineMatch = Regex.Match(result.Text, linePattern);
if (lineMatch.Success)
{
var lineValue = lineMatch.Value;
Console.WriteLine("Customer Invoice number: " + lineValue);
}
}
Imports IronOcr
Imports System
Imports System.Text.RegularExpressions
Private orc = New IronTesseract()
Using input = New OcrInput("r2.png")
Dim result = orc.Read(input)
Dim linePattern = "INV\/\d{4}\/\d{5}"
Dim lineMatch = Regex.Match(result.Text, linePattern)
If lineMatch.Success Then
Dim lineValue = lineMatch.Value
Console.WriteLine("Customer Invoice number: " & lineValue)
End If
End Using
請求書スキャニング
IronOCRのインボイスOCR APIは、機械学習とコンピュータビジョンを使用して請求書からのデータ抽出を革命的に変えます。 この技術は、請求書のテキストと数値を機械が読み取れる形式に変換し、分析、統合、およびプロセス改善のためのデータ抽出を簡素化します。 それは請求書処理の自動化、精度の向上、および買掛金のようなワークフローの最適化に対する堅牢なソリューションを提供します。 この技術により、スキャンされた請求書からの自動データ入力も可能です。
IronOCRは、追加の設定なしでTesseractから最良の結果を使用することにより、高い精度を提供します。 サポートしますマルチページ フレーム TIFF, PDFファイルおよびすべての一般的な画像フォーマット。 以下のように翻訳することも可能です:
また、可能です画像からバーコードの値を読み取る.
ご訪問くださいホームページウェブサイトIronOCR に関する詳細情報は、こちらをご覧ください。 請求書OCRのチュートリアルについては、以下をご参照ください詳細 請求書 OCR チュートリアル. 請にコンピュータビジョンを使用して請求書フィールドなどのテキストを検索する方法について知るには、こちらのサイトをご覧ください。コンピュータビジョンの使い方.
9つの .NET API製品 オフィス文書用