How to Build an Azure OCR Service using IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Iron Softwareは、Azure OCR統合から相互運用性の問題を取り除くOCR(光学式文字認識)ライブラリを作成しました。 Azure上のOCRライブラリで作業することは、開発者にとって常にちょっとした苦痛でした。 このようなOCRの問題を解決するのがIronOCRです。

マイクロソフトAzureのIronOCR機能

Run([HttpTrigger] HttpRequest hrRequest, ExecutionContext ecContext) { var URI = hrRequest.Query["image"]; var saStream = await hcClient.GetStreamAsync(URI); var ocr = new IronTesseract(); using (var inputOCR = new OcrInput(saStream)) { var outputOCR = ocr.Read(inputOCR); return new OkObjectResult(outputOCR.Text); } } } ``` この機能は、受け取った画像を直接OCRエンジンに送り、抽出したテキストを出力します。 MicrosoftによるMicrosoft Azureの概要: *Microsoft Azure Microservicesは、各コア機能(サービス)が独立して構築、デプロイされるアプリケーション構築のアーキテクチャアプローチです。 マイクロサービス・アーキテクチャは分散型で疎結合であるため、1つのコンポーネントに障害が発生してもアプリ全体が壊れることはありません。独立したコンポーネントが連携し、明確に定義されたAPIコントラクトで通信します。 急速に変化するビジネスニーズに対応し、新機能を迅速に市場に投入するためのマイクロサービスアプリケーションを構築してください。

.NETまたはMicrosoft Azureを使用したIronOCRの特徴は以下の通りです。 * ほぼすべてのファイル、画像、PDFに対してOCRを実行できること。 * 電光石火のスピード in processing OCR input * 卓越した正確さ * BarCodeとQRコードを読み取ります。 * SaaSは不要で、ローカルで実行できます。 * PDFや画像を検索可能なドキュメントに変換できる。 * Microsoft Cognitive ServicesのAzure OCRに代わる優れたソリューション ## OCRのパフォーマンスを向上させる画像フィルター

。 * IronOCRは125の国際言語をサポートしています。 各言語には、Fast、Standard、Bestの品質があります。 利用可能な言語パックの一部を含みます: * ブルガリア語 * アルメニア語 * クロアチア語 * アフリカーンス語 * デンマーク語 * チェコ語 * フィリピン語 * フィンランド語 * フランス語 * ドイツ語 * 他にも多くの言語パックがありますので、次のリンクからご覧ください。 [IronOCR言語パック](https://ironsoftware.com/csharp/ocr/languages/)。 * .NET * Xamarinのサポート * Monoのサポート * Microsoft Azureのサポート * Microsoft Azure上のDockerのサポート * PDFドキュメントをサポート * マルチフレームTiffをサポート * すべての主要な画像形式をサポート * 以下の.NET Frameworkをサポートしています: * .NET Framework 4.5以上 * .NET Standard 2 * .NET Core 2 * .NET Core 3 * .NET Core 5 * IronOCRはTesseract(Unicodeと100以上の言語をサポートするオープンソースのOCRエンジン)をインストールする必要はありません。 * Tesseractよりも精度が向上しています。 * Tesseractよりもスピードが向上しています。 * 文書やファイルの低品質スキャンを修正します。 * 文書やファイルの低品質な斜めスキャンを修正します。 ## 光学式文字認識 (OCR) とは何ですか? ウィキペディアによると光学式文字認識(Optical Character Recognition)とは、スキャンした文書、文書の写真、場面写真、画像に重ね合わせた字幕テキストなど、タイプされた印刷テキストの画像を電子的または機械的に機械エンコードされたテキストに変換することである。 OCRはOptical Character Recognitionの略です。 光学式文字認識には、基本的に4つのタイプがあります: * OCR - Optical Character Recognition(光学式文字認識)は、入力文書からタイプライターで書かれたテキストを、1文字ずつ、またはグリフ(合意された記号セット内の要素記号、たとえば、異なるフォントの「a」)ずつ読み取ります。 * OWR - Optical Word Recognition(光学式単語認識)は、入力文書からタイプされたテキストを1単語ずつ認識します。 * ICR - Intelligent Character Recognition(知能文字認識)は、印刷スクリプト(他の文字と結合しない文字)や草書体などの印刷テキストを対象に、1文字または1グリフずつ認識します。 * IWR - Intelligent Word Recognitionは、筆記体を対象としています。

よくある質問

Azure上のC#アプリケーションにOCR機能を統合するにはどうすれば良いですか?

Azure上のC#アプリケーションにOCR機能を統合するには、新しいコンソールアプリケーションを作成し、NuGet経由でIronOCRをインストールします。Install-Package IronOcrコマンドを使用するか、NuGetパッケージマネージャーでIronOCRを検索します。

AzureのネイティブOCRサービスよりIronOCRを使用する利点は何ですか?

IronOCRは、精度の向上、高速な処理速度、SaaSを必要としないローカル実行能力など、AzureのネイティブOCRサービスに対するいくつかの利点を提供します。また、幅広い言語をサポートし、OCRパフォーマンスを向上させるイメージフィルターも備えています。

Microsoft Azure FunctionでOCRテキスト抽出を設定する方法は?

Microsoft Azure FunctionでOCRテキスト抽出を設定するには、IronOCRを使用して画像からテキストを抽出する機能を作成できます。これはマイクロサービスアーキテクチャの一部であり、AzureアプリケーションにOCR機能をシームレスに統合できます。

IronOCRはOCR処理で複数の言語を扱うことができますか?

はい、IronOCRは125の国際言語をサポートしており、それぞれがFast, Standard, Bestの品質で利用可能です。これにより、グローバルなアプリケーションに対応できます。

IronOCRはOCR精度を向上させるためにどのような画像処理オプションを提供していますか?

IronOCRは、Rotate, Binarize, ToGrayScale, Contrast, DeNoise, Invert, Dilate, Erode, Deskew, DeepCleanBackgroundNoise, EnhanceResolutionなど、OCR結果の精度と信頼性を向上させるための様々な画像処理オプションを提供します。

IronOCRはAzure展開用にさまざまな.NETフレームワークと互換性がありますか?

はい、IronOCRは.NET Framework 4.5以降、.NET Standard 2、.NET Core 2、.NET Core 3、.NET Core 5と互換性があります。また、Xamarin、Monoにも対応しており、Microsoft Azure上でDockerと一緒に展開できます。

IronOCRをAzureで実行するために追加のソフトウェアが必要ですか?

IronOCRをAzureで実行するために追加のソフトウェアは必要ありません。それは独立して機能し、インストールなしでTesseractよりも精度と速度が向上しています。

IronOCRのライセンスオプションにはどのようなものがありますか?

IronOCRは、一度の購入、永久ライセンスモデルに基づく3つの有料ライセンス層を提供しています。これらのライセンスは開発目的で無料であり、プロジェクトのスケーリングに柔軟性を提供します。

IronOCRを使用して画像とPDFを検索可能なドキュメントに変換するにはどうすれば良いですか?

IronOCRはOCR機能を利用してテキストを抽出し認識することにより、画像とPDFを検索可能なドキュメントに変換できます。これにより、簡単に検索またはインデックスに追加できます。

IronOCRを使用してバーコードとQRコードを読み取るプロセスは何ですか?

IronOCRは、これらのコードからデータをスキャンして抽出するための内蔵機能を使用して、バーコードとQRコードを読み取ります。これにより、C#アプリケーションでの統合が容易になります。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

準備はいいですか?
Nuget ダウンロード 5,044,537 | バージョン: 2025.11 ただ今リリースされました