IRONOCRの使用

請求書のためのOCRソリューションを作成する方法

公開済み 2024年2月18日
共有:

イントロダクション

光学文字認識、またはOCR(光学式文字認識)、コンピューターが画像やスキャンした文書からテキストを識別および抽出する技術です。 テキストを含む写真を機械可読なテキストデータに変換することがOCRソフトウェアの主な目的です。 この技術の幅広い用途は、多くの業界に恩恵をもたらします。例えば、データ入力、文書のデジタル化、および支払勘定のプロセスなどの自動化手続きを効率化します。 この記事では、請求書を処理するためのOCRソリューションの使用方法と、それがどのようにして手動による請求書処理を不要にするかを見ていきます。

請求書に対するOCRソリューションの使用方法

  1. インストールIronOCRC#ライブラリ。

  2. Visual Studioで新しいC#プロジェクトを作成する

  3. 豊富な機能を備えたC#ライブラリで、領収書上のOCRを実行します。

  4. Tesseractを利用して、レシートからデータを抽出する

  5. 抽出されたテキスト結果で特定のデータを探します。

  6. 提供されたレシート画像のバーコード値を確認してください。

請求書処理とは何ですか?

企業はOCR請求書処理を利用することにより、画像ベースまたはスキャンされた請求書を機械可読テキストに変換できます。これにより、請求書からのテキストとデータの抽出が自動化されます。 この自動化により、財務手続きの効率が全体的に向上し、手動のデータ入力が減少し、請求書の処理が簡素化されます。

IronOCR

IronOCRは、開発者がC#およびVB.Netアプリケーションから画像やPDFドキュメントを読み取り、テキストを抽出することを可能にします。IronOCRは、製品の高いパフォーマンスと正確性で知られており、Microsoft OCRとTesseract OCRの技術を組み合わせています。これにより、複雑なレイアウトや出版物、手書きのテキストに対しても高い認識率を誇ります。

  • サポートされるファイル形式: PNG, JPG, GIF, TIFF, BMP, PDF
  • ユニークな機能: 複数言語のテキスト認識、回転・歪みの補正、ノイズ除去
  • 導入が簡単: .NETフレームワークや.NET Coreプロジェクトに簡単に統合可能
  • ライセンスオプション: Lite License, Plus License, Professional License, Unlimited License

IronOCRの利点

  1. 高い認識精度: IronOCRは最新のOCR技術を利用し、正確なテキスト抽出を実現します。
  2. 迅速な処理: 高速な処理速度で大量のドキュメントを効率的に処理できます。
  3. シンプルな統合: APIがシンプルで使いやすいため、開発者は短時間で機能を実装できます。

IronOCRを活用することで、あなたのアプリケーションは自動化されたデータ抽出機能を備え、業務効率を大幅に向上させることができます。

光学文字認識 (OCR)(OCR (光学式文字認識))C#プログラミング言語を使用する開発者によって可能にされますIronOCR 、.NETライブラリ。 IronOCRは、Iron Softwareによって作られたツールであり、写真、スキャンしたドキュメント、およびPDFファイルからテキストを抽出することができるため、自動テキスト認識が必要なアプリケーションにとって便利です。 請求書からテキストとデータを抽出するには、IronOCRを使用して自動請求書処理を行うために、IronOCRライブラリを.NETアプリケーションに統合する必要があります。

IronOCRはAIアルゴリズムを使用することで詐欺を防ぎます。 これにより、ミス、不正行為、および重複する請求書を迅速に特定できます。 優れたOCRの請求書データ抽出機能により、人為的なデータ入力によるミスを回避し、エラーを減らします。 IronOCRチェックについてさらに学ぶ[以下の内容を日本語に翻訳します:

ここに

ご希望のイディオムや技術用語が追加されることによって、より適切な翻訳が提供できる場合もありますので、詳細なコンテキストを教えていただけると幸いです。](/csharp/ocr/docs/).

IronOCRの顕著な特長:

  • テキスト抽出: 画像、スキャンされたドキュメント、およびPDFファイルから、IronOCRを使用してテキストコンテンツを抽出できます。 提供された文書の中の単語、文字、およびレイアウトを識別するために、高度なOCRアルゴリズムを使用します。
  • 請求書の写真からテキスト情報を抽出するには、IronOCRを使用します。 これは、ベンダーに関する情報、明細行、請求書番号、日付、およびその他の関連データを取得することを意味します。
  • バーコードの読み取り: IronOCRにはOCRに加えて画像からバーコードを読み取る機能があり、テキストとバーコードデータの両方を処理する必要があるアプリケーションに対する適応性が向上します。
  • 画像前処理:台形補正、ノイズ除去、およびコントラスト補正は、IronOCRがサポートする画像前処理方法の一部です。 入力画像を強化することによって、これらの前処理手順はOCRの精度を向上させるのに役立ちます。
  • ゾーンベースのOCR技術:OCRゾーンを定義することにより、開発者はテキスト抽出を集中させるべき画像内の特定の領域を指定することができます。 整理されたレイアウトの書類を管理する際に、この機能が役立ちます。
  • OCRソフトウェアは、取得した画像や文書を処理することで、スキャンまたは撮影された情報からテキストをスキャンして抽出します。 ドキュメントのレイアウト、単語、および文字はOCRエンジンによって解釈されます。

    OCR設定の正確さ、請求書の複雑さ、入力画像の品質が、ソリューションの成功に影響を与えることを忘れないことが重要です。 さらに、IronOCRのAPIを使用し、ライブラリが提供する特定の機能を理解することが、統合プロセスにおいて必要なステップとなる場合があります。 最新の詳細と推奨事項については、常に公式のIronOCR資料を参照してください。

Visual Studioで新しいプロジェクトを作成

Visual Studio プログラムを起動した後、「ファイルメニュー」に移動します。 「新しいプロジェクト」に移動し、「コンソールアプリケーション」を選択します。 この投稿では、コンソールプログラムを使用してPDFドキュメントを作成します。

請求書のためのOCRソリューションを作成する方法: 図1 - Visual Studioを通じて新しいプロジェクトを作成する

関連するテキストボックスにプロジェクト名を入力し、ファイルの場所を選択してください。 次に、以下の画像に示されているように、「Create」ボタンをクリックし、必要な .NET フレームワークを選択します。

請求書のためのOCRソリューションを作成する方法: 図2 - プロジェクト情報の設定

アプリケーションが選択されたので、Visual Studio プロジェクトはその構造を作成します。 コンソール、Windows、またはWebバージョンを選択した場合、program.csファイルが開かれるため、コードを追加してアプリケーションをビルド/実行することができます。

コードをテストするために、その後、ライブラリを追加することができます。

IronOCRをインストールする

Visual Studio の NuGet パッケージ管理ツールを使用して、直接ソリューションにパッケージをインストールすることが可能です。 以下のスナップショットは、NuGetパッケージマネージャーを表示するために使用できます。

請求書のためのOCRソリューションを作成する方法: 図3 - Visual Studioを通じてNuGetパッケージマネージャーにアクセスする方法

以下の内容を日本語に翻訳します:

NuGetウェブサイトのパッケージリストを表示するための検索ボックスが備わっています。以下のスクリーンショットに示されているように、パッケージマネージャーで「IronOCR」というフレーズを検索する必要があります。

請求書のためのOCRソリューションを作成する方法: 図4 - NuGetパッケージマネージャーを使用してIronOCRをインストールする

上記のグラフィックは、関連する検索用語のリストを提供してくれるかもしれません。 ソリューションパッケージをインストールするために必要な選択をしなければなりません。

請求書からデータを抽出するためのIronOCR

IronOCRは、データを抽出し、請求書データを読み取るために使用できる強力なOCRライブラリです。 IronOCRを使用すれば、レシートの写真を撮り、データプライバシーを損なうことなく、処理および分析しやすい機械判読可能なテキストに変換することができます。 Invoice OCRを使用すると、請求書のデータをデジタル形式に抽出できます。

これはIronOCRがベンダー請求書を処理し、紙の請求書からテキストを抽出する方法の一例です。

using System;
using System.Collections.Generic;
using IronOcr;
var Ocr = new IronTesseract(); // nothing to configure            
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"invoice.png"); // adding the example invoice to read
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
using System;
using System.Collections.Generic;
using IronOcr;
var Ocr = new IronTesseract(); // nothing to configure            
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"invoice.png"); // adding the example invoice to read
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
Imports System
Imports System.Collections.Generic
Imports IronOcr
Private Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("invoice.png") ' adding the example invoice to read
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
VB   C#

以下は、上記のコードの結果です:

請求書のためのOCRソリューションを作成する方法: 図5 - 前のコードからの出力されたテキスト

上記の例は、IronOCRがOCR処理を行い、抽出されたデータをコンソールに表示するのを助けたことを示しています。

請求書のバーコードを読み取る

テキストに加えて、領収書上のバーコードもIronOCRを使用してスキャンできます。 領収書のバーコードをスキャンするために IronOCR を使用するには、BarcodeReader クラスと共に ReadBarCodes 関数を使用する必要があります。

これは、IronOCRを使用して領収書の画像をバーコード読み取りのためにデコードする方法の例です。

var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("invoice.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("invoice.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
Dim ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Using ocrInput As New OcrInput("invoice.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	For Each barcode In ocrResult.Barcodes
		Console.WriteLine(barcode.Value)
	Next barcode
End Using
VB   C#

請求書のためのOCRソリューションの作成方法:図6 - 入力されたバーコード

IronOCRは強力なOCR機能を提供しますが、請求書処理の全体的なワークフローには、データの検証、ビジネスロジック、金融システムとの接続など、他の要素も必要であることを忘れないでください。 特定の使用ケースによっては、完全な請求書処理ソリューションを実現するために、IronOCRを追加のツールやコンポーネントと組み合わせる必要があるかもしれません。

結果:

請求書のためのOCRソリューションを作成する方法: 図7 - 上記のコードを使用して例のバーコードを読み取った結果

IronOCRのオンラインデモについて詳しく知るには、参照してください[以下の内容を日本語に翻訳します:

ここに

ご希望のイディオムや技術用語が追加されることによって、より適切な翻訳が提供できる場合もありますので、詳細なコンテキストを教えていただけると幸いです。](/csharp/ocr/demos/).

結論

強力で適応性のあるオプティカル キャラクター レコグニション (Optical Character Recognition)(OCR (光学式文字認識))C#開発者向けのライブラリIronOCR結論として、際立っています。 写真、スキャンしたドキュメント、およびPDFファイルからのテキスト抽出が、Iron Softwareの.NETライブラリが提供するこの包括的な機能コレクションにより、可能かつ簡単になります。

最後に、IronOCR は、優れた統合性、柔軟性、そして正確性を提供する素晴らしいOCRソリューションです。 他に類を見ない正確性、高度なアルゴリズム、および手書き文書を含む幅広い文書形式を識別する能力のおかげで、IronOCR は現在市場で最も優れた OCR ソリューションであり、初心者が迅速かつ容易に学べるようにするコード例を含む優れた文書を提供します。

IronOCRのコスト効果の高い開発版はアクセス可能であり、IronOCRパッケージを購入することで、ライフタイムライセンスが取得できます。 IronOCRパッケージは$Lite Licenseから提供されているため、複数のシステムに対して単一の料金で非常に高い価値を提供します。 それは、IronOCRライセンスユーザーに対し、24時間365日のオンラインエンジニアサポートを提供します。 IronOCRをご覧くださいウェブサイト料金に関する詳細情報については、こちらをご覧ください。

< 以前
C#でOCRレシートスキャナーを作成する方法
次へ >
開発者向けOCR自動化ガイド