透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
光学式文字認識(OCR)は、請求書のような文書処理において現在最も重要な技術です。 それは、教育から産業レベルまで、ビジネスのあらゆる側面で進化してきました。 あらゆる場所でOCRソフトウェアの使用を目にすることができます。なぜなら、手動によるデータ入力の使用を減らすからです。 開発者が請求書を処理するためのOCRソフトウェアアプリケーションを構築する際に使用できる多くの種類の請求書OCR APIがあります。
この記事では、請求書処理やその他のOCR処理のための、3つのC#請求書OCRオープンソースソフトウェアとライブラリについて探ります。 また、C#プロジェクトに高度なOCR機能を統合するための開発者向けの最高の有料オプションであるIronOCRについても(それらとは別に)話し合います。 オープンソースのオプションを使って始めましょう。
テッセラクトOCRは、元々ヒューレット・パッカードによって開発され、現在はグーグルによって管理されている強力なオープンソースOCRエンジンです。様々な種類のドキュメントを読み取り、それらを使用可能なデータに変換することができます。 それは複数の言語をサポートしており、グローバル企業にとって貴重なリソースとなります。
C# 開発者は、その汎用性と抽出精度のために Tesseract OCR を非常に有用と感じています。 Tesseractをソフトウェアアプリケーションに組み込むことにより、開発者は新しい請求書を効率的に処理し、注文書や税額などのデータおよび関連情報を抽出することができます。 抽出したデータを使用して、PDF請求書から請求書番号と項目を抽出することができます。
.NET アプリケーションへの統合: C# プロジェクトでは、Tesseract OCR の統合には Tesseract .NET SDK またはラッパーを活用します。これにより、OCR 機能を組み込むための効率的な方法が提供されます。 統合により、開発者は慣れ親しんだ.NET環境内で作業でき、スムーズな開発プロセスが保証されます。
文字認識: Tesseract OCRは、さまざまな画像形式からのテキストの認識と抽出において優れています。 それは、スキャンされたドキュメントやPDFファイルから、さまざまな照明条件や角度で撮影された画像まで、幅広い種類のドキュメントを処理するのに優れています。
複数言語のサポート: Tesseract の大きな強みの一つは、100以上の言語をサポートしていることです。 これは、多様な言語ソースからのテキストデータを処理および分析する必要があるグローバルなアプリケーションにとって、非常に汎用性の高いツールとなります。
カスタマイズとトレーニング:Tesseractは、開発者が新しいフォントや言語でエンジンをトレーニングすることを可能にし、特定のビジネスニーズや文書タイプに適したカスタマイズされたOCRソリューションを提供します。この機能は、専門的な文書や珍しいフォントのテキストを認識する際に特に有益です。
Emgu CV C#はOpenCVライブラリの.NETラッパーです。 それは、開発者がC#プロジェクト内でOpenCVの機能を簡単に使用できるようにします。 それは、画像処理、コンピュータビジョン、およびそれに関連する他の分野のための豊富なツールキットを提供します。 請求書を処理して構造化データを抽出するのに非常に役立ちます。
それは、画像やドキュメントからテキストを抽出するためにTesseract OCRエンジンを利用しています。 このステップは正確性を要し、あらゆる請求書からデータを抽出する主なステップです。このラッパーの主なメソッドは、画像からテキストを編集可能で検索可能なデータに変換するTesseract.Recognize()です。 開発者は請求書処理のワークフローの効率を向上させることができます。
Here are some of the primary advantages of using Emgu CV:
Using Emgu CV can significantly enhance the development of computer vision projects by providing a reliable and efficient framework for image processing tasks.
クロスプラットフォーム:Emgu CV は .NET をサポートするあらゆるプラットフォームで動作します。これには iOS、Android、Mac OS、Linux、Windows が含まれます。
クロスランゲージ: C#以外にも、Emgu CVはVB.NET、C++、IronPythonを含む複数の言語で使用可能です。 この製品は、広範なサンプルコードと、充実したドキュメントによる強力なサポートを提供します。
At9T、または (a9t9) としても知られる、無料のOCR(光学式文字認識)ソフトウェアアプリケーションを提供しています。 このソフトウェアは、美しいグラフィカルユーザーインターフェース (GUI) を使用して、PDFや画像からデータを抽出するために使用できます。 それは完全にC#言語で書かれています。 これは、インテリジェントなドキュメント処理を使用してPDFを検索可能なドキュメントに変換する非常に簡単で使いやすい方法を提供します。
そのGUIは、ワンクリックでソリューションを求める開発者以外の人々にも市場を拡大するのに役立ちます。 このソフトウェアは非常に簡単にインストールして使用できます。 個人および業務使用に利用できます。 多くのOCRタスクを効率的に実行できます。 私たちはPDF請求書をアップロードして、請求書の日付、品目、合計などのデータを抽出することができます。ファイルをアップロードしてOCRを開始するボタンを押すだけで、請求書の処理が開始されます。
ユーザー フレンドリーなインターフェース: そのユーザー インターフェースは使いやすいです。 それはシンプルさを念頭に設計されました。 経験のない人でも簡単に使用できます。
複数言語対応: 英語、オランダ語、日本語、韓国語など、多くの言語をサポートしています。
バッチ処理: このソフトウェアは、複数のファイルを同時にOCR処理できます。多数のファイルからデータを抽出したい場合、時間を節約できます。
上述の通り、オープンソースの選択肢には多くの困難があります。 Tesseractを私たちのプロジェクトに統合するのは簡単ではありません。 使用するにはラッパーが必要です。 Emgu CVを使用するには、OpenCVを知っている必要があります。そうでなければ、学習経験が困難になり、さらに詳細なドキュメントもありません。 同時に、At9Tは複雑な文書には適していません。
これらの問題を克服し、OCRソリューションを進化させるために、IronOCRが最適な選択です。 IronOCRは、Tesseract 5エンジンの機能を拡張し、OCRのためのより高度なオプションを追加する.NET OCRライブラリです。 Tesseractやその他のライブラリと異なり、.NETプロジェクトに非常に簡単に統合できます。
IronOCRは、PDF、PNG、JPG、BMPなどの複数のドキュメント形式をサポートしています。 .NETフレームワークおよびプラットフォームの広範な範囲をサポートしており、WindowsやmacOSなども含まれています。 世界中で使用できるOCR製品として、127以上の言語でOCR機能を実行できます。 驚異的なインボイスOCR技術を使用して、すべてのインボイス形式からデータを抽出できます。 IronOCRは、最高のテキスト認識のために機械学習を使用します。 IronOCRの主な機能を見てみましょう。
以下はその主な機能のまとめです:
入力の柔軟性: 画像(JPG、PNG、BMP)、マルチページ/フレームファイル(TIFF、GIF)、System.Drawingオブジェクト、ストリーム、最適化されたDPIのPDFを含むさまざまな形式から読み取ります。
高度なフィルター: フィルタウィザード、画像補正(シャープ化、解像度向上、ノイズ除去、膨張、収縮)、画像の向き補正(回転、傾き補正、スケール)、およびカラー補正(二値化、グレースケール、反転、カラー置換、テキストカラー選択)などのフィルターが利用でき、OCRの前に最適な画像品質を確保します。
リージョン選択: CropRectangle を使用してドキュメントの特定の領域をOCR用に選択できます。
データ出力: .NETテキスト文字列、バーコード、QRデータ、画像としてシンプルなデータ出力を提供します。
構造化データ: ページ、ブロック、段落、行、単語、および文字の形式で構造化データ出力を提供します。
ドキュメントのエクスポート: ドキュメントを検索可能なPDF、HTML、またはページ、テキスト、バーコード、QRコードの画像としてエクスポートできるようにします。
テキストのハイライトと保存:文字、単語、行、段落をハイライトして保存する機能。
言語とフレームワーク: C#、VB.NET、F#をサポートし、.NET 8、7、6、5、Core 2x & 3x、Standard 2、Framework 4.6.2+に対応しています。
オペレーティングシステム: Microsoft Windows、macOS、Linux、Docker、Azure、AWSとの多様な互換性。
IDEサポート: Microsoft Visual StudioおよびJetBrains ReSharper & Riderで完全にサポートされています。
請求書からデータを抽出するためのIronOCRを使用したサンプルコードは以下の通りです:
// Create IronOCR Tesseract Instance
IronTesseract tesseract = new IronTesseract();
// Create an OcrInput object
using (OcrInput input = new OcrInput("sample_invoice.png")) // You can directly pass the image path to the constructor
{
// Read and store OcrResults object
OcrResult result = tesseract.Read(input);
// Get all text from the OCR result
string allText = result.Text;
// Print to console
Console.WriteLine(allText);
}
// Create IronOCR Tesseract Instance
IronTesseract tesseract = new IronTesseract();
// Create an OcrInput object
using (OcrInput input = new OcrInput("sample_invoice.png")) // You can directly pass the image path to the constructor
{
// Read and store OcrResults object
OcrResult result = tesseract.Read(input);
// Get all text from the OCR result
string allText = result.Text;
// Print to console
Console.WriteLine(allText);
}
' Create IronOCR Tesseract Instance
Dim tesseract As New IronTesseract()
' Create an OcrInput object
Using input As New OcrInput("sample_invoice.png") ' You can directly pass the image path to the constructor
' Read and store OcrResults object
Dim result As OcrResult = tesseract.Read(input)
' Get all text from the OCR result
Dim allText As String = result.Text
' Print to console
Console.WriteLine(allText)
End Using
こちらは、請求書画像から抽出した出力データです:
データ認識を使用してデータ分析を行い、その分析結果をCSVファイルにエクスポートすることができます。
結論として、画像や文書からテキストを読み取る(OCR技術)場合、選択肢は数多くあります。 Tesseract OCR、Emgu CV、およびAt9Tはすべて、誰でも利用できる無料ツールです。 それぞれがそれぞれのやり方で優れています。
しかし、請求書のOCRでより高度な機能が必要で、かつそれがあなたのニーズに合う場合は、$749からライセンスを開始することができます。
プログラマーとしてプロジェクトにテキスト読み取り機能を追加したい場合や、ビジネスとしてドキュメントをより効率的に処理したい場合など、多くの選択肢があります。 Tesseract、Emgu CV、At9Tのような無料ツールは、良い出発点です。 しかし、より本格的なものをお求めの場合は、IronOCRは多くの高度な機能を提供します。 重要なのは、あなたの具体的なニーズに合った適切なツールを選ぶことです。