IRONOCRの使用

コンピュータビジョンによるOCR(例題チュートリアル)

更新済み 3月 28, 2023
共有:

光学文字認識 (OCR) (OCR (光学式文字認識)) は、画像からテキストを読み取り解釈することができる技術であり、データ処理と自動化をより迅速かつ効率的にします。 この記事では、IronOCRライブラリを使用したOCRコンピュータビジョンの使用ガイドラインと、それがテキスト認識を強化し、このプロセスの自動化にどのように役立つかについて説明します。

なぜOCRが重要なのか?

OCRおよびコンピュータビジョン 光学文字認識の高度な形式です (OCR (光学式文字認識)) 画像からテキスト文字をより正確かつ効率的に認識するために、人工知能と機械学習アルゴリズムの力を活用します。

コンピュータビジョン画像処理アルゴリズムにより、OCRシステムは画像内のテキストのコンテキストやレイアウトを理解し、文字の形状や構造に基づいて文字を認識することができます。 OCRとコンピュータビジョンは、複数のフォント、スタイル、サイズを持つ複雑な画像からテキストを抽出できるため、ドキュメントのデジタル化、データ抽出、および自動化において貴重なツールとなります。

IronOCR: C# OCRライブラリ

IronOCR は、画像やドキュメントからテキストを抽出するためにコンピュータビジョン技術を使用する人気のあるOCRライブラリです。 使用が簡単で、C#およびVB.NETを含む複数のプログラミング言語と統合できます。 IronOCRはオンプレミスとクラウドの両バージョンで利用可能で、画像からテキストを処理および抽出するための幅広い機能を提供します。

IronOCRのインストール

IronOCR をインストールするには、NuGet パッケージ マネージャー コンソールで次のコマンドを使用します:

:ProductInstall

IronOCRを使用したOCRシステム

以下の画像は、のテストに使用されます コンピュータビジョン付きOCRシステム using IronOCR.

コンピュータビジョンを使用したOCR(例のチュートリアル)、図1:OCR検出に使用した画像サンプル

OCR検出に使用される画像サンプル

テキスト領域を検索

について `FindTextRegion (テキスト領域を検索)もちろん、英語のテキストを教えていただけますでしょうか? このメソッドは、画像内の単一のテキスト領域を識別するために使用されます。 メソッドには、ScaleDilationAmountBinarize、および Invert を含むいくつかのオプションのパラメーターが含まれます。 スケールは画像のサイズを調整し、DilationAmount はテキストの太さを増加させ、Binarize は画像を白黒に変換し、Invert は画像の色を反転させます。

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
	inputOCR.FindTextRegion()
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

コードを実行した後、テキスト領域から機械学習プロセスを使用してテキストが抽出されることがわかります。 出力結果は、ほぼ100%のテキスト認識精度でコンソールに表示されます。 IronOCRの精度は、印刷されたテキストでも手書きのテキストでも、ほぼ100%です。

コンピュータビジョンを用いたOCR(例:チュートリアル)、図2:テキスト抽出プロセスからのコンソール結果

テキスト抽出プロセスからのコンソール結果

複数のテキスト領域を見つけるメソッド

について FindMultipleTextRegions(複数のテキスト領域を検索) このメソッドはFindTextRegionメソッドに似ていますが、画像内に複数のテキスト領域がある場合に使用されます。 それは各テキスト領域の位置を定義する CropRectangle オブジェクトのリストを返します。 この方法は、複数のテキストセクションを含む画像からテキストを抽出したい場合に便利です。

using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

上記のコードスニペットは、IronOCRライブラリを使用して画像ファイルに対してOCRを実行する方法の例です。まず、IronOCRライブラリをインポートし、新しいインスタンスを作成します。 IronTesseract クラス。 次に、それを初期化します OcrInput(OCR入力) 入力画像ファイルのパスを含むオブジェクトを取得し、適用します 画像補正のためのいくつかの前処理技術 「FindMultipleTextRegions」メソッドを使用して。

その後、 `読取 (読み取り)もちろん、英語のテキストを教えていただけますでしょうか? IronTesseractオブジェクトのメソッドで、事前処理された画像に対してOCRを実行し、結果を返します。 OcrResult オブジェクト OcrResultオブジェクトから抽出されたテキストは文字列変数に格納され、コンソールに出力されます。

IronOCRの出力

IronOCRの出力は非常に正確であり、複数のフォント、サイズ、およびテキストのスタイルを含む複雑な画像にも対応できます。

OCRの精度は、画像からデータを抽出する際に非常に重要です。なぜなら、抽出されたテキストは、データ分析、手動データ入力、機械学習、自然言語処理などのさらなる処理に使用されるからです。 抽出されたテキストにエラーが含まれている場合、後続の工程で問題が発生する可能性があります。 さらに、IronOCRを使用すると、結果オブジェクトを調査することができます。 信頼度レベルを確認.

OCRコンピュータビジョンのユースケース

光学文字認識 (OCR) (OCR (光学式文字認識)) テクノロジーは印刷および手書きのテキストの処理方法に革命をもたらしました。 OCRツールは、文書処理とデータ抽出に欠かせない存在となっています。 以下は、光学文字認識ソフトウェアの使用例です:

OCR ナンバープレート認識

ナンバープレート認識 交通管理、駐車システム、および法執行活動の自動化において重要な役割を果たします。 OCRコンピュータビジョンをC#で実装することにより、開発者は画像やライブビデオフィードから迅速かつ正確にナンバープレートを識別するアプリケーションを作成できます。 この技術は以下の用途に使用できます:

  • 交通違反を監視し、犯罪行為に関与している車両を特定します。
  • 駐車システムを自動化し、入退出管理を容易にし、請求プロセスを効率化します。

  • 制限区域内での車両の動きを追跡および監視することにより、安全対策を強化します。

請求書からテキストを抽出

C#でのOCRコンピュータビジョンは、ツールを使ってOCRアプリケーションを開発し、自動化するのに利用できます 請求書からのテキストの抽出 その他の金融書類。 このプロセスは手入力によるデータ入力エラーを大幅に削減し、会計業務を効率化することができます。 主な利点には次のものがあります:

  • データ入力プロセスを自動化することによって生産性が向上しました。
  • 精度の向上、OCRは人為的なエラーの可能性を低減します。

  • 効率的なデータ管理のための会計ソフトウェアおよびシステムとのシームレスな統合。

OCR字幕生成

動画の字幕を作成することは時間がかかり、労力を要する作業です。C#でのOCRコンピュータビジョンにより、このプロセスを自動的に簡素化できます。 画面上のテキストを検出および文字起こし開発者が以下を可能にする:

  • 映画、テレビ番組、オンライン動画のために正確な字幕を作成する。
  • 聴覚障害のある方や異なる言語を話す方のためのアクセシビリティを向上させましょう。

  • ビデオプラットフォームのための検索可能でインデックス化可能なコンテンツを提供することで、SEOの取り組みを強化する

OCR PDF処理

PDFは、ドキュメントの共有や保存に広く使用されていますが、テキストを抽出するのは難しいことがあります。 C#でのOCRコンピュータビジョンは、開発者がPDFファイルを簡単に処理するOCRアプリケーションを構築するのに役立ちます。 内容を抽出する促進する

印刷されたテキストのデジタル化

OCRソフトウェアは広く使用されています 文書画像から印刷されたテキストをデジタル化する. OCRツールはスキャンされたデジタル文書からテキストを抽出できます。 PDFファイル、および さまざまな形式の画像. これは文書管理において特に有用であり、テキストベースの文書を簡単に検索、保存、および共有することができます。

手書きテキストの抽出

OCR技術は、 手書きテキストを認識 高精度で。 これは、医療記録に手書きのメモが含まれていることが多い医療分野などで特に役立ちます。 OCRツールは、診療記録、処方箋ラベル、その他の手書き文書から手書きのテキストを抽出することができます。

データ抽出

OCR技術は、請求書、領収書、フォームなどの入力データからデータを抽出するために広く使用されています。 OCRモデルは、名前、住所、日付、金額などの主要データフィールドを認識して抽出することができます。 これにより手動でのデータ入力の必要がなくなり、データ処理のエラーが減少します。

画像検索

OCR技術は、含まれているテキストに基づいて画像を検索する画像検索にも使用されます。 これは特に大規模な画像ライブラリに便利で、手動での検索は時間がかかる場合があります。

翻訳

OCRソフトウェアは、ある言語の文書からテキストを抽出し、それを別の言語に翻訳するために使用できます。 これは、文書を迅速かつ正確に翻訳する必要がある国際的な企業にとって特に便利です。

サマリー

光学文字認識 (OCR (光学式文字認識)) は、コンピュータが画像からテキストを読み取ることを可能にする技術です。 OCRとコンピュータービジョンは、自己運転車、ロボティクス、自動化された文書処理などのアプリケーションにおいて、機械が視覚的な世界を理解し解釈することを可能にするため、重要です。

IronOCRは、コンピュータビジョンを使用してOCRを適用し、画像からテキストを正確に認識してテキスト抽出を実行するための強力なOCRエンジンです。 これは、FindTextRegionFindMultipleTextRegionsGetTextRegions を含む、テキスト領域を検索および抽出するためのさまざまな方法を提供します。 各メソッドには、使用できる独自のパラメータセットがあります OCRプロセスを微調整する そして高いOCR精度を提供します。

IronOCRを使用することで、入力画像からスキャンされたテキストを迅速かつ正確に抽出することができます。 並行性 以下のコンテンツを日本語に翻訳してください: カスタマイズされた構成大量の入力画像データを扱う際に、時間と労力を節約できます。 スキャンされたドキュメント、写真、またはスクリーンショットを扱う場合、IronOCRが含まれているテキストの抽出を支援します。

IronOCRは、 無料トライアル 購入の判断を下す前にソフトウェアをテストしたいユーザーへ。 について IronOCRのライセンス $599から始まり、1年間のサポートとアップデートが含まれます。 その強力な機能と手頃な価格により、IronOCRは高いOCR精度を持つ信頼できるOCRソリューションを求めている人にとって素晴らしい選択肢です。

< 以前
OCRレシートデータ抽出(ステップバイステップチュートリアル)
次へ >
C#で運転免許証をOCRする方法

準備はできましたか? バージョン: 2024.9 新発売

無料のNuGetダウンロード 総ダウンロード数: 2,290,361 View Licenses >