OCRツール

画像をテキストに変換する方法

Kannaopat Udonpant
カンナパット・ウドンパント
2024年10月24日
共有:

現在のデジタル時代では、画像ベースのコンテンツを読みやすい編集可能な検索可能なテキストに変換します。 これは、紙ベースの文書のアーカイブ、画像からの重要な情報の抽出、または印刷された資料のデジタル化などのシナリオで特に重要です。 光学式文字認識(OCR)技術は、この変換プロセスを自動化する解決策を提供します。 これを達成するための非常に信頼性が高く効率的なツールの1つは、IronOCR、.NET用の強力なOCRライブラリです。

この記事では、IronOCR を使用して画像をテキストに変換する方法を説明し、この変換がデータ抽出、アーカイブ、文書処理などのプロセスをどのように時間を節約し、エラーを減らし、効率化できるかを探ります。

画像をテキストに変換する方法

  1. OCR作業のためのC#ライブラリをダウンロード

  2. 新しい`IronTesseract`インスタンスを作成します

  3. `OcrImageInput`を使用して画像を読み込みます。

  4. 画像の内容を読み取るには、[**OcrRead**](/csharp/ocr/object-reference/api/IronOcr.IronTesseract.html#IronOcr_IronTesseract_Read_IronOcr_OcrInputBase_) を使用します。

  5. OCR結果をテキストファイルにエクスポートする

画像をテキストに変換する理由

画像をテキストに変換したい理由はたくさんあります:

  • データ抽出: アーカイブやデータ処理目的のためにスキャンされた文書や画像からテキストを抽出する。
  • スキャンしたコンテンツの編集: 以前にスキャンしたドキュメント内のテキストを編集または更新することで、コンテンツを手動で再入力する手間を省くことができます。
  • アクセシビリティの向上: 印刷物をデジタルテキストに変換し、スクリーンリーダーやテキスト読み上げアプリケーションで利用できるようにします。
  • 自動化: 請求書、領収書、または名刺からテキストを読み取ることにより、データ入力と処理を自動化します。

画像をテキストに変換する方法

IronOCRの強力な画像からテキストへの変換機能を利用して画像からテキストを抽出する方法を探る前に、オンラインツールdocsumoを使用した一般的なステップバイステップのプロセスをまず見てみましょう。 オンラインOCRツールは、手動でセットアップする必要がないため、気軽なOCR作業、あるいは単発のOCR作業を行う場合に便利なオプションです。もちろん、定期的にOCR作業を行う必要がある場合は、IronOCRのような強力なOCRツールを使用した方が良いでしょう。

  1. オンラインOCRツールに移動する

  2. 画像をアップロードして、抽出プロセスを開始します。

  3. 翻訳結果データをテキスト文書としてダウンロードする

ステップ1:オンラインOCRツールに移動する

画像ファイルからテキストを抽出するためにOCR技術を利用し始めるには、まず、使用したいオンライン画像OCRツールに移動します。

画像をテキストに変換する方法:図1 - Docsumo OCRツール

ステップ2:画像のアップロードと抽出プロセスの開始

さて、「ファイルをアップロード」ボタンをクリックして、テキストを抽出したい画像ファイルをアップロードします。 ツールは直ちに画像の処理を開始します。

画像をテキストに変換する方法:図2 - Docsumo - ファイル処理

ステップ3:結果のデータをテキスト文書としてダウンロードする

画像の処理が終わったので、抽出したテキストを新しいテキスト文書としてダウンロードし、さらに使用したり操作したりすることができます。

画像をテキストに変換する方法: 図3 - Docsumo - 画像処理完了

また、ファイルを表示し、さまざまなセクションをハイライトして、その中に含まれるテキストを表示することもできます。 これは、特定のセクション内のテキストを表示したい場合に特に役立つ可能性があります。 その後、テキスト文書、XLS、またはJSONとしてテキストをダウンロードすることができます。

画像をテキストに変換する方法: 図 4

IronOCRの使い始め方

IronOCRは、画像に対してOCR操作を行うことができる多用途の.NETライブラリです。 さまざまな機能を備えており、PNG、JPEG、TIFF、PDF などのさまざまなファイル形式を処理し、画像補正を行い、専門文書 (パスポート、ナンバープレートなど) をスキャンし、スキャンしたファイルに関する高度な情報を提供し、スキャンした文書を変換し、テキストを強調表示できます。

IronOCRライブラリのインストール

IronOCRを使って画像を読み始める前に、プロジェクトにまだインストールされていない場合はインストールする必要があります。 IronOCRはVisual StudioのNuGetを使って簡単にインストールできます。 NuGetパッケージマネージャーコンソールを開き、以下のコマンドを実行してください:

Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
$vbLabelText   $csharpLabel

あるいは、NuGet Package Manager for SolutionページからIronOCRを検索してインストールすることもできます。

画像をテキストに変換する方法:図5

あなたのコードでIronOcrを使用するには、コードの先頭に適切なimport文を記述してください:

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

画像をテキストに変換する:基本的な例

まず始めに、IronOCRを使った基本的な画像からテキストへの例を見てみましょう。 これは、どのOCRツールでも中核となる機能であり、この例では、オンラインツールで使用したPNGファイルを使用します。 この例では、まずIronTesseractクラスをインスタンス化し、変数「ocr」に割り当てています。 次に、OcrImageInput クラスを使用して、提供された画像ファイルから新しい OcrImageInput オブジェクトを作成します。 最後に、Read メソッドは、画像からテキストを読み取り、OcrResult オブジェクトを返します。 その後、抽出されたテキストにアクセスして、ocrResult.Textを使用してコンソールに表示することができます。

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

出力画像

画像をテキストに変換する方法: 図6

異なる画像フォーマットへの対応

IronOCRはPNG、JPEG、BMP、GIF、TIFFのような複数の画像フォーマットをサポートしています。 異なる画像フォーマットからテキストを読み取るプロセスは同じで、正しい拡張子のファイルを読み込むだけです。

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

OCR精度の向上

OCRの性能は、画像を最適化し、言語、画像解像度、画像のノイズレベルなどのオプションを設定することで向上させることができます。 こちらは、DeNoise() および Sharpen() メソッドを使用して、品質を改善する必要がある画像からのテキスト抽出の精度を向上させるためのOCRの微調整方法です。

using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Using IronOcr IronTesseract ocr = New IronTesseract()
	Using image As New OcrImageInput("example.png")
		image.DeNoise()
		image.Sharpen()
		Dim ocrResult As OcrResult = ocr.Read(image)
		Console.WriteLine(ocrResult.Text)
	End Using
End Using
$vbLabelText   $csharpLabel

抽出したテキストのエクスポート

画像からテキストに変換するプロセスの基本がわかったところで、次に、できあがったテキストを後で使えるようにエクスポートする方法を見てみましょう。 この例では、先ほどと同じプロセスで画像を読み込み、スキャンします。 次に、File.WriteAllText("output.txt", ocrResult.Text) を使用して、'output.txt' という名前の新しいテキストファイルを作成し、抽出したテキストをファイルに保存します。

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
File.WriteAllText("output.txt", ocrResult.Text)
$vbLabelText   $csharpLabel

画像をテキストに変換する方法: 図7

IronOCRの主な機能

  1. 高精度: IronOCRは高度なTesseract OCRアルゴリズムを使用し、複雑な画像を処理するための内蔵ツールを含んでおり、高精度を確保します。

  2. 多言語サポート: 125以上の言語をサポートしており、ラテン文字、キリル文字、アラビア文字、アジアの文字などの複数の書体を含みます。 ただし、IronOCRと一緒にインストールされるのは英語だけであり、他の言語を使用するには、その言語の追加言語パックをインストールする必要があります。

  3. PDF OCR: IronOCRはスキャンされたPDFからテキストを抽出できるため、文書のデジタル化において貴重なツールです。

  4. 画像のクリーンアップ: 画像の品質を向上させ、より良いOCRの精度を得るために、傾き補正ノイズ除去反転などの前処理ツールを提供します。

  5. 簡単な統合: API はコンソールアプリ、ウェブアプリ、デスクトップソフトウェアなど、あらゆる .NET プロジェクトとシームレスに統合されます。

画像をテキストに変換する一般的な使用例

  • データ入力の自動化:企業はOCRを使用して、フォーム、領収書、または名刺からデータを自動的に抽出できます。
  • 文書のアーカイブ: 組織は物理的な文書をデジタル化し、検索可能で保存が容易になります。
  • アクセシビリティ: 印刷された資料をテキストに変換し、スクリーンリーダーやその他の支援技術で使用します。
  • リサーチと分析: スキャンした研究資料を迅速にテキストに変換し、分析や他のソフトウェアツールへの統合に利用します。
  • 研究:スキャンした研究ノートを編集可能なテキストに変換し、それをIronWord、Microsoft WordやGoogleドキュメントなどのツールでさらに操作できるようにWord文書として保存します。

結論

IronOCRを使用して画像からテキストを変換することは、文書処理タスクを処理するための高速で正確かつ効率的な方法です。 スキャン文書、デジタル画像、PDF文書のいずれを扱う場合でも、IronOCRは高精度、多言語サポート、強力な画像処理ツールを提供し、プロセスを簡素化します。 このツールは、文書管理ワークフローの合理化、データ抽出の自動化、アクセシビリティの向上を目指す企業に最適です。

無料トライアルを利用して、今日からIronOCRの強力な機能を試してみてください。数分でワークスペース内で完全に機能させることができるので、すぐにOCRタスクの処理を始められます!

Kannaopat Udonpant
カンナパット・ウドンパント
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、カンナパットは日本の北海道大学から環境資源学の博士号を取得しました。学位を取得する過程で、カンナパットはバイオプロダクション工学部に所属する車両ロボティクス研究所のメンバーにもなりました。2022年には、C#のスキルを活かしてIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。カンナパットは、IronPDFで使用されているコードの大部分を作成した開発者から直接学べることに価値を見いだしています。同僚との学び合いに加えて、Iron Softwareで働くことの社会的側面も楽しんでいます。コードやドキュメントを書いていない時には、カンナパットは通常、PS5でゲームをしたり、『The Last of Us』を再視聴したりしています。
< 以前
EasyocrとTesseractの比較(OCR機能の比較)
次へ >
レシートOCRライブラリ(開発者向けリスト)