機械学習ソフトウェアを使用した画像からのテキスト抽出
機械学習を利用したキャプチャ画像やスキャン文書からのテキスト抽出は、コンピュータビジョンと自然言語処理の交差点で急成長している分野である。 この技術は、高度な機械学習、オブジェクト認識アルゴリズム、高度なグラフィックソフトウェア、ディープウェブ、ダークウェブ、ニューラルネットワークアーキテクチャを活用し、画像やスキャンした紙文書からテキスト情報を正確に識別・抽出する。 光学式文字認識のような様々な機械学習技術を採用することで(OCR (光学式文字認識))とディープラーニングにより、ビジュアルシーンのテキスト検出を編集・検索可能な構造化データに自動化・効率化し、そこにオブジェクトを検出することができる。
このような進化する状況の中で、研究者や実務家は精度、速度、汎用性を向上させる努力を続けており、画像、機械可読データ、スキャン文書からのテキスト検出・抽出は、印刷文書のデジタル化、コンテンツ索引作成、翻訳、アクセシビリティ向上などのアプリケーションにおいて極めて重要な要素となっている。
この記事では、画像からテキストを抽出する方法について説明します。IronOCR強力な機械学習アルゴリズムとテキスト関連機能を搭載したOCRライブラリです。 テキスト抽出は、キーワード抽出としても知られ、機械学習に基づいて、構造化されていないデータや企業の中央データベースから関連する、または基本的な単語やフレーズを自動的にスキャンして抽出する。
機械学習を使って画像からテキストを抽出するには?
-
画像からテキストを抽出するC#(シーシャープ)ライブラリをダウンロード。
-
シーンテキスト認識用のOcrInputオブジェクトをインスタンス化して、特定の画像をロードする。
-
ocrTesseract.Readメソッドを使用して画像からデータを抽出します。
-
Console.WriteLine**メソッドを使用して、抽出したテキストをコンソールに表示します。
- CropRectangleオブジェクトを使用して、画像の領域にOCRを実行する。
IronOCR- OCR(光学式文字認識)ライブラリ
IronOCR は、著名で洗練された光学式文字認識です。(OCR (光学式文字認識))は、画像や文書からのテキスト抽出技術の最前線に立つソフトウェアです。 Iron Software)により開発されたこの強力なOCRエンジンは、スキャンした画像、PDF、またはテキストの写真でさえ、編集可能で検索可能なデジタルコンテンツに正確かつ効率的に変換するように設計されています。 機械学習アルゴリズムとニューラルネットワークの巧みな使用により、IronOCRは、データ抽出、コンテンツ・インデックス作成、正確なテキスト認識を必要とする自動化プロセスなど、様々なアプリケーションに堅牢なソリューションを提供します。
多言語や多様なフォントを扱うことができるため、ソフトウェアやアプリケーションに合理的なテキスト認識アルゴリズム抽出機能を求める開発者や企業の両方にとって、汎用性の高いツールとなっています。 IronOCRを使用すると、テキスト抽出アルゴリズムを使用して、構造化されていないデータを完全にスキャンされたページに変換する一般的なテキスト認識技術を使用して、テキストを自動的にスキャンすることができます。
IronOCRのインストール
IronOCRはNuGet Package Managerを使ってインストールすることができます。
-
まず、新しいC# Visual Studioプロジェクトを作成するか、既存のプロジェクトを開きます。
-
プロジェクトが作成されたら、上部メニューのToolsからNuGet Package Managerを選択し、NuGet Package Manager for Solutionを選択します。
-
新しいウィンドウが画面に表示されます。 参照」タブに移動し、検索バーに「IronOCR 」と入力します。
-
IronOCRパッケージのリストが表示されるので、最新のものを選択してインストールをクリックする。
- C#(シーシャープ)プロジェクトでIronOCRを使用できるようになるまで、あなたのインターネット環境に応じて数秒かかります。
画像から編集・検索可能なデータへのテキスト検出
IronOCRを使えば、画像処理技術と機械学習を使って簡単にテキストを抽出することができます。 このセクションでは、IronOCR を使って画像からテキストを抽出する方法について説明する。
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput("images\image.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
このC#コードは、光学式文字認識ライブラリIronOCR の使い方を示しています。(OCR (光学式文字認識)). 以下はステップバイステップの説明です:
- ライブラリのインポート: もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
IronOCR を使用;
using System; もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
コードは、OCR機能を提供するIronOcrと、一般的な機能のためのSystem名前空間を含む、必要なライブラリをインポートすることから始まります。
- IronTesseractの初期化とイメージの読み込み: もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
ocrTesseract = 新しいIronTesseract(); もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
この行はIronOCRが提供するOCRエンジンであるIronTesseractのインスタンスを作成します。
using (var ocrInput = new OcrInput(@"images\image.png"))
using (var ocrInput = new OcrInput(@"images\image.png"))
Using ocrInput As New OcrInput("images\image.png")
OcrInput**オブジェクトは、処理する画像へのパスを指定してインスタンス化される。 この場合、画像ファイルは "images "ディレクトリの "image.png "である。
- OCRの実行とテキストの抽出: もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
var ocrResult = ocrTesseract.Read(ocrInput); もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
この行は、OcrInputオブジェクトを渡して、IronTesseractインスタンスのReadメソッドを呼び出します。 この方法は、提供された画像に対してOCRを実行し、テキストを抽出する。
- 抽出したテキストを表示する: もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
Console.WriteLine(ocrResult.Text); もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
最後に、抽出されたテキストはConsole.WriteLineを使ってコンソールに出力され、画像から得られたOCR結果が表示されます。
このコード・スニペットはIronOCRを使って指定された画像のテキスト認識OCRを実行し、抽出されたテキストをコンソールに出力します。
入力画像
出力
画像上の指定された領域にOCRを実行する
IronOCRを使って画像上の特定の領域にOCRを実行することもできます。 もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
IronOCR を使用;
を使用しています;
using System;
ocrTesseract = 新しいIronTesseract();
使用して(var ocrInput = 新しい OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, 幅: 400, 高さ: 50);
ocrInput.AddImage("r3.png", ContentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
} もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。
このC#(シーシャープ)コードは、光学式文字認識のためのIronOCR ライブラリを使用しています。(OCR (光学式文字認識)). まず、IronOCRやSystem. OCRエンジンであるIronTesseractインスタンスが作成される。 このコードでは、CropRectangleを使用して処理する画像内の特定のContentAreaを設定し、定義された領域に焦点を合わせます。 画像("r3.png")この指定された領域内は、OCR処理のために追加される。 OCRエンジンは、指定されたコンテンツ領域を読み取り、テキストを抽出し、結果のテキストは、Console.WriteLineを使用してコンソールに出力されます。
出力
結論
機械学習による画像からのテキスト抽出、特に光学式文字認識を採用(OCR (光学式文字認識))IronOCRのようなライブラリは、コンピュータ・ビジョンと自然言語処理の交差点における革新的な進歩を意味する。 高度な機械学習アルゴリズムとニューラルネットワークを搭載したこのテクノロジーは、手書き文字、印刷文字、複雑なタイポグラフィなど、さまざまな種類の画像からテキストを正確に解読・抽出する。 OCR技術もディープラーニング技術も、視覚的なテキストを編集可能で検索可能なデータに効率的に変換する上で極めて重要な役割を果たしており、文書のデジタル化、コンテンツのインデックス化、アクセシビリティの向上といった重要な目的に役立っている。
IronOCRは、著名なOCRライブラリとして、この融合の可能性を例証しており、スキャンした画像やPDFを、複数の言語やフォントスタイルにまたがるデジタルで編集可能なコンテンツに正確に変換することに優れています。 C#(シーシャープ)のようなプログラミング言語へのシームレスな統合は、合理的な実装を可能にし、多くのアプリケーションやドメインにおける画像からのテキスト抽出の変換効果をさらに増幅します。
詳細についてはIronOCRおよびすべての関連機能は、このリンクをご覧ください。これ. 画像からテキストを抽出するための完全なチュートリアルは、次のサイトで入手できます。リンク. IronOCRのライセンスはこちらから購入できます。リンク.