フッターコンテンツにスキップ
IRONOCRの使い方

レシートスキャンAPI(開発者向けチュートリアル)

レシートスキャンAPIは、高度なOCR技術を使ってレシートから重要なデータを抽出します。 手作業によるミスをなくし、生産性を高めることで、データ入力プロセスを合理化します。 多用途で正確なAPIは、複数の言語、通貨、フォーマットに対応しています。 レシートの解析を自動化することで、企業は支出パターンを把握し、データに基づいた意思決定を行うことができます。 この記事では、C# OCRライブラリIronOCRを使用して、領収書から重要な情報を抽出する方法を示します。

IronOCRについて

IronOCRはIron Softwareによって開発された汎用性の高いOCRライブラリとAPIで、開発者にスキャン文書、画像、PDFなど様々なソースからテキストを抽出する強力なソリューションを提供します。 高度なOCRアルゴリズム、コンピュータービジョン、機械学習モデルにより、IronOCRは困難なシナリオにおいても高い精度と信頼性を保証します。 このライブラリは、複数の言語とフォントスタイルをサポートしているため、グローバルなアプリケーションに適しています。 機械学習モデル機能を持つIronOCRをアプリケーションに組み込むことで、開発者はデータ入力、テキスト分析、その他の作業を簡単に自動化し、生産性と効率を高めることができます。

IronOcrを使えば、開発者はドキュメント、写真、スクリーンショット、さらにはライブカメラの映像をJSONレスポンスとして含む様々なソースからテキストを簡単に取得することができます。 IronOCR 画像データを分析し、個々の文字を認識し、機械可読テキストに変換します。 この抽出されたテキストは、データ入力、情報検索、テキスト分析、手動タスクの自動化など、さまざまな目的に使用できます。

前提条件

IronOCRを使い始める前に、いくつかの前提条件があります。 これらの前提条件は以下のとおりです:

1.コンピュータに適切な開発環境がセットアップされていることを確認してください。 通常、Visual Studioなどの統合開発環境(IDE)がインストールされている必要があります。 2.C#プログラミング言語の基本的な理解を持っていることが重要です。 これにより、記事で提供されるコード例を効果的に理解し、修正することができます。 3.あなたのプロジェクトにIronOCRライブラリがインストールされている必要があります。 これは、Visual Studio内のNuGetパッケージマネージャを使用するか、コマンドラインインタフェースを介して達成することができます。

これらの前提条件が満たされていることを確認することで、IronOCRを使用するプロセスに飛び込む準備が整います。

新しい Visual Studio プロジェクトの作成

IronOCRを使い始めるために、最初のステップは新しいVisual Studioプロジェクトを作成することです。

Visual Studioを開き、[Files]に移動し、[New]にカーソルを合わせ、[Project]をクリックします。

レシート・スキャンAPI(開発者向けチュートリアル)、図1:新しいプロジェクトのイメージ新しいプロジェクトイメージ</strong

新しいウィンドウで、[Console Application]を選択し、[Next]をクリックします。

レシート・スキャンAPI(開発者向けチュートリアル)、図2:コンソール・アプリケーションコンソールアプリケーション </strong

新しいウィンドウが表示されます。 新しいプロジェクトの名前と場所を入力し、[次へ]をクリックします。

領収書スキャンAPI(開発者向けチュートリアル)、図3:プロジェクトの構成プロジェクト設定</strong

最後に、ターゲットフレームワークを指定し、[作成]をクリックします。

レシートスキャンAPI(開発者向けチュートリアル)、図4:ターゲットフレームワークターゲットフレームワーク</strong

新しいVisual Studioプロジェクトができたので、IronOCRをインストールしましょう。

IronOCRのインストール

**NuGetパッケージマネージャ**。 > **Manage NuGet Packages for Solution** を選択して、NuGet Package Managerグラフィカル・ユーザー・インターフェースに移動します。 [領収書スキャン API (開発者向けチュートリアル), 図 5: NuGet パッケージ マネージャ](/static-assets/ocr/blog/receipt-scanning-api-tutorial/receipt-scanning-api-tutorial-5.webp)。 **NuGetパッケージマネージャ**。 この後、新しいウィンドウが表示されます。 IronOCRを検索し、プロジェクトにパッケージをインストールしてください。 [領収書スキャンAPI(開発者向けチュートリアル)、図6:Ocr](/static-assets/ocr/blog/receipt-scanning-api-tutorial/receipt-scanning-api-tutorial-6.webp)領収書スキャンAPI(開発者向けチュートリアル)、図6:Ocr

**NuGetパッケージマネージャ**。 > **Package Manager Console** 2.パッケージマネージャーコンソールタブに以下の行を入力してください: ```shell :ProductInstall ``` [レシートスキャンAPI(開発者向けチュートリアル)、図7:パッケージマネージャーコンソール](/static-assets/ocr/blog/receipt-scanning-api-tutorial/receipt-scanning-api-tutorial-7.webp) **パッケージマネージャコンソール**

(); var unitPrices = new List(); var taxes = new List(); var amounts = new List(); var lines = result.Text.Split('\n'); foreach (var line in lines) { // Match each line against the description pattern var descriptionMatch = Regex.Match(line, descriptionPattern); if (descriptionMatch.Success) { descriptions.Add(descriptionMatch.Groups[1].Value.Trim()); unitPrices.Add(decimal.Parse(descriptionMatch.Groups[2].Value)); // Calculate tax and total amount for each item var tax = unitPrices[unitPrices.Count - 1] * 0.15m; taxes.Add(tax); amounts.Add(unitPrices[unitPrices.Count - 1] + tax); } } // Output the extracted data for (int i = 0; i < descriptions.Count; i++) { Console.WriteLine($"Description: {descriptions[i]}"); Console.WriteLine($"Quantity: 1.00 Units"); Console.WriteLine($"Unit Price: ${unitPrices[i]:0.00}"); Console.WriteLine($"Taxes: ${taxes[i]:0.00}"); Console.WriteLine($"Amount: ${amounts[i]:0.00}"); Console.WriteLine("-----------------------"); } } } } ``` 下記のように、IronOCRは領収書から必要なテキストを簡単に抽出することができます。 [領収書スキャンAPI(開発者向けチュートリアル)、図8:出力](/static-assets/ocr/blog/receipt-scanning-api-tutorial/receipt-scanning-api-tutorial-8.webp)。 **アウトプット**

よくある質問

C#でOCRを使って領収書データの抽出を自動化するにはどうすればよいですか?

C#では、IronOCRを使用して領収書からラインアイテム、価格、税金、総額などの主要な詳細を高精度で抽出することができ、データ抽出を自動化できます。

C#で領収書スキャンプロジェクトを設定するための前提条件は何ですか?

C#で領収書スキャンプロジェクトを設定するには、Visual Studio、基本的なC#プログラミング知識、およびプロジェクトにインストールされたIronOCRライブラリが必要です。

Visual StudioでNuGetパッケージマネージャーを使用してOCRライブラリをインストールするにはどうすればよいですか?

Visual Studioを開いて、ツール > NuGetパッケージマネージャー > ソリューションのNuGetパッケージを管理する に移動し、IronOCRを検索してプロジェクトにインストールします。

Visual Studioコマンドラインを使用してOCRライブラリをインストールできますか?

はい、Visual Studioでパッケージマネージャーコンソールを開き、Install-Package IronOcr コマンドを実行することで、IronOCRをインストールできます。

OCRを使用して領収書全体のテキストを抽出するにはどうすればよいですか?

領収書全体のテキストを抽出するには、IronOCRを使用して領収書の画像全体に対してOCRを実行し、その抽出されたテキストをC#コードで出力します。

領収書スキャンAPIにはどのようなメリットがありますか?

IronOCRのような領収書スキャンAPIは、データ抽出の自動化、手動エラーの最小化、生産性の向上、支出パターンの洞察を提供し、より良いビジネス意思決定を可能にします。

OCRライブラリは複数の言語や通貨をサポートしていますか?

はい、IronOCRは複数の言語、通貨、領収書フォーマットをサポートしており、グローバルなアプリケーションに最適です。

画像からテキストを抽出する際のOCRライブラリの精度はどのくらいですか?

IronOCRは、先進のOCRアルゴリズム、コンピュータビジョン、機械学習モデルを使用して、高精度を保証します。困難なシナリオでも信頼性があります。

OCRを使用して領収書からどのようなデータを抽出できますか?

IronOCRは、ラインアイテム、価格、税額、総額、その他の領収書の詳細を抽出することができます。

領収書解析を自動化することでビジネスプロセスをどのように改善できますか?

IronOCRを使用して領収書解析を自動化することで、手動入力を削減し、正確なデータ収集が可能になり、データ駆動型の意思決定をサポートします。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。