透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
光学式文字認識(OCR)は、機械が画像からテキストを読み取り解釈することを可能にする技術であり、データ処理と自動化をより速く、より効率的にします。 この記事では、IronOCRライブラリを使用したOCRコンピュータビジョンの使用ガイドラインと、それがテキスト認識を強化し、このプロセスの自動化にどのように役立つかについて説明します。
コンピュータビジョンを使用したOCRは、光学文字認識(OCR)の高度な形式であり、人工知能と機械学習アルゴリズムの力を利用して、画像からテキスト文字をより正確かつ効率的に認識します。
コンピュータビジョン画像処理アルゴリズムにより、OCRシステムは画像内のテキストのコンテキストやレイアウトを理解し、文字の形状や構造に基づいて文字を認識することができます。 OCRとコンピュータビジョンは、複数のフォント、スタイル、サイズを持つ複雑な画像からテキストを抽出できるため、ドキュメントのデジタル化、データ抽出、および自動化において貴重なツールとなります。
IronOCRは、コンピュータビジョン技術を用いて画像や文書からテキストを抽出するための人気のあるOCRライブラリです。 使用が簡単で、C#およびVB.NETを含む複数のプログラミング言語と統合できます。 IronOCRはオンプレミスとクラウドの両バージョンで利用可能で、画像からテキストを処理および抽出するための幅広い機能を提供します。
IronOCR をインストールするには、NuGet パッケージ マネージャー コンソールで次のコマンドを使用します:
:ProductInstall
次の画像は、IronOCRを使用してコンピュータービジョンを用いたOCRシステムのテストに使用されます。
OCR検出に使用される画像サンプル
FindTextRegion
メソッドは、画像内の単一のテキスト領域を識別するために使用されます。 このメソッドはいくつかのオプションのパラメータを受け取ります。それには、Scale
、DilationAmount
、Binarize
、およびInvert
が含まれます。 Scaleは画像のサイズを調整し、DilationAmount
はテキストの太さを増加させ、Binarizeは画像を白黒に変換し、Invert
は画像の色を反転させます。
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg"))
{
inputOCR.FindTextRegion();
OcrResult result = ocr.Read(input);
string resultText = result.Text;
Console.WriteLine(resultText);
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg"))
{
inputOCR.FindTextRegion();
OcrResult result = ocr.Read(input);
string resultText = result.Text;
Console.WriteLine(resultText);
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
inputOCR.FindTextRegion()
Dim result As OcrResult = ocr.Read(input)
Dim resultText As String = result.Text
Console.WriteLine(resultText)
End Using
コードを実行した後、テキスト領域から機械学習プロセスを使用してテキストが抽出されることがわかります。 出力結果は、ほぼ100%のテキスト認識精度でコンソールに表示されます。
テキスト抽出プロセスのコンソール結果
FindMultipleTextRegions
メソッドFindMultipleTextRegions
メソッドは、FindTextRegion
メソッドに似ていますが、画像に複数のテキスト領域がある場合に使用されます。 これは、各テキスト領域の位置を定義するCropRectangle
オブジェクトのリストを返します。 この方法は、複数のテキストセクションを含む画像からテキストを抽出したい場合に便利です。
using IronOcr;
var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
OcrResult result = ocr.Read(input);
string resultText = result.Text;
Console.WriteLine(resultText);
}
using IronOcr;
var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
OcrResult result = ocr.Read(input);
string resultText = result.Text;
Console.WriteLine(resultText);
}
Imports IronOcr
Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
Dim result As OcrResult = ocr.Read(input)
Dim resultText As String = result.Text
Console.WriteLine(resultText)
End Using
上記のコードスニペットは、IronOCRライブラリを使用して画像ファイルでOCRを実行する方法の例です。最初にIronOCRライブラリをインポートし、新しいIronTesseract
クラスのインスタンスを作成します。 その後、入力画像ファイルのパスでOcrInput
オブジェクトを初期化し、FindMultipleTextRegions
メソッドを使用して画像補正のためのいくつかの前処理技術を適用します。
その後、IronTesseract
オブジェクトの Read
メソッドを呼び出し、前処理された画像に対してOCRを実行し、OcrResult
オブジェクトを返します。 OcrResult
オブジェクトから抽出されたテキストは、文字列変数に保存され、コンソールに出力されます。
IronOCRの出力は非常に正確であり、複数のフォント、サイズ、およびテキストのスタイルを含む複雑な画像にも対応できます。
OCRの精度は、画像からデータを抽出する際に非常に重要です。なぜなら、抽出されたテキストは、データ分析、手動データ入力、機械学習、自然言語処理などのさらなる処理に使用されるからです。 抽出されたテキストにエラーが含まれている場合、後続の工程で問題が発生する可能性があります。 さらに、IronOCRでは、結果オブジェクトを調査して信頼度レベルを確認することができます。
光学文字認識(OCR)技術は、印刷されたテキストの取り扱い方法を革命的に変えました。 OCRツールは、文書処理とデータ抽出に欠かせない存在となっています。 以下は、光学文字認識ソフトウェアの使用例です:
ナンバープレート認識は、交通管理、駐車システム、および法執行活動の自動化において重要な役割を果たしています。 OCRコンピュータビジョンをC#で実装することにより、開発者は画像やライブビデオフィードから迅速かつ正確にナンバープレートを識別するアプリケーションを作成できます。 この技術は以下の用途に使用できます:
C#でのOCRコンピュータービジョンを利用して、請求書やその他の財務書類からのテキスト抽出を自動化するOCRアプリケーションを開発できます。 このプロセスは手入力によるデータ入力エラーを大幅に削減し、会計業務を効率化することができます。 主な利点には次のものがあります:
ビデオの字幕作成は、時間がかかり労力を要する作業です。C#でのOCRコンピュータービジョンは、このプロセスを簡素化し、画面上のテキストを自動で検出して文字起こしすることができ、開発者が次のことを可能にします:
PDFは、ドキュメントの共有や保存に広く使用されていますが、テキストを抽出するのは難しいことがあります。 C#でのOCRコンピュータビジョンは、開発者がPDFファイルを簡単に処理し、その内容を抽出するOCRアプリケーションを構築するのに役立ち、以下を促進します。
OCRソフトウェアは、ドキュメント画像から印刷されたテキストをデジタル化するために広く使用されています。 OCRツールは、スキャンされたデジタル文書、PDF、およびさまざまな形式の画像からテキストを抽出できます。 これは文書管理において特に有用であり、テキストベースの文書を簡単に検索、保存、および共有することができます。
OCR技術は、請求書、領収書、フォームなどの入力データからデータを抽出するために広く使用されています。 OCRモデルは、名前、住所、日付、金額などの主要データフィールドを認識して抽出することができます。 これにより手動でのデータ入力の必要がなくなり、データ処理のエラーが減少します。
OCR技術は、含まれているテキストに基づいて画像を検索する画像検索にも使用されます。 これは特に大規模な画像ライブラリに便利で、手動での検索は時間がかかる場合があります。
OCRソフトウェアは、ある言語の文書からテキストを抽出し、それを別の言語に翻訳するために使用できます。 これは、文書を迅速かつ正確に翻訳する必要がある国際的な企業にとって特に便利です。
光学文字認識(OCR)は、コンピューターが画像からテキストを読み取ることを可能にする技術です。 OCRとコンピュータービジョンは、自己運転車、ロボティクス、自動化された文書処理などのアプリケーションにおいて、機械が視覚的な世界を理解し解釈することを可能にするため、重要です。
IronOCRは、コンピュータビジョンを使用してOCRを適用し、画像からテキストを正確に認識してテキスト抽出を実行するための強力なOCRエンジンです。 これは、FindTextRegion
、FindMultipleTextRegions
、GetTextRegions
など、テキスト領域を見つけて抽出するためのさまざまなメソッドを提供します。 各メソッドには固有のパラメーターのセットがあり、それを使用してOCRプロセスを微調整し、高いOCR精度を提供できます。
IronOCRを使用することで、並行処理とカスタマイズされた構成を利用して、入力画像からスキャンされたテキストを迅速かつ正確に抽出できます。これにより、大量の入力画像データを扱う際の時間と労力を節約できます。 スキャンされたドキュメント、写真、またはスクリーンショットを扱う場合、IronOCRが含まれているテキストの抽出を支援します。
IronOCR は、購入を決定する前にソフトウェアをテストしたいユーザーに無料トライアルを提供します。 IronOCRのライセンスは、$749から始まり、1年間のサポートと更新が含まれています。 その強力な機能と手頃な価格により、IronOCRは高いOCR精度を持つ信頼できるOCRソリューションを求めている人にとって素晴らしい選択肢です。