フッターコンテンツにスキップ
OCRツール

画像をテキストに変換する方法

現在のデジタル時代では、画像ベースのコンテンツを読みやすく、編集可能で、検索可能なテキストに変換することが重要です。 これは特に、紙ベースのドキュメントのアーカイブ、画像からの重要な情報の抽出、印刷物のデジタル化のシナリオで重要です。 光学文字認識(OCR)技術は、この変換プロセスを自動化するための解決策を提供します。 これを実現するための高信頼で効率的なツールのひとつが、.NETのための強力なOCRライブラリであるIronOCRです。

この記事では、IronOCRを使用して画像をテキストに変換する方法を説明し、この変換がどのように時間を節約し、エラーを減らし、データ抽出、アーカイブ、ドキュメント処理のようなプロセスを合理化するかを探ります。

画像をテキストに変換する方法

  1. OCR作業用のC#ライブラリをダウンロード
  2. 新しいIronTesseractインスタンスを作成
  3. OcrImageInputを使用して画像を読み込む
  4. OcrReadを使用して画像の内容を読む
  5. OCR結果をテキストファイルにエクスポート

画像をテキストに変換する理由

画像をテキストに変換したい理由はいくつかありますが、以下を含みます:

  • データ抽出:スキャンしたドキュメントや画像からテキストを抽出して、アーカイブやデータ処理用に使用。
  • スキャンしたコンテンツの編集:以前にスキャンしたドキュメントのテキストを編集または更新し、手動で内容を再入力する時間を節約。
  • アクセシビリティの向上:印刷物をデジタルテキストに変換し、スクリーンリーダーやテキスト読み上げアプリケーションでの使用を可能に。
  • 自動化:請求書、領収書、名刺からのテキスト読み取りによるデータ入力と処理の自動化。

画像をテキストに変換する方法の開始

IronOCRの強力な画像からテキストへの変換機能を活用して画像からテキストを抽出する方法を探る前に、まずオンラインツールを使用する一般的なプロセスを見てみましょう。Docsumoです。 手動でのセットアップが不要であるため、カジュアルまたは一度きりのOCRタスクを行う人にとってはオンラインOCRツールは便利なオプションです。当然ながら、定期的にOCRタスクを行う必要がある場合は、IronOCRのような強力なOCRツールがより適しているかもしれません。

  1. オンラインOCRツールに移動
  2. 画像をアップロードして抽出プロセスを開始
  3. 生成されたデータをテキスト文書としてダウンロード

ステップ1: オンラインOCRツールに移動

画像ファイルからテキストを抽出するためにOCR技術を使用するには、まず使用したいオンライン画像OCRツールに移動します。

画像をテキストに変換する方法: 図1 - Docsumo OCRツール

ステップ2: 画像をアップロードして抽出プロセスを開始

"ファイルをアップロード"ボタンをクリックすることで、テキストを抽出したい画像ファイルをアップロードすることができます。 ツールはすぐに画像の処理を開始します。

画像をテキストに変換する方法: 図2 - Docsumo - ファイル処理

ステップ3: 結果データをテキスト文書としてダウンロード

画像の処理が完了したので、抽出されたテキストを新しいテキスト文書としてダウンロードし、さらなる処理や操作に使用できます。

画像をテキストに変換する方法: 図3 - Docsumo - 画像処理完了

ファイルを表示して、さまざまなセクションを強調表示してその中に含まれるテキストを見ることもできます。 特定のセクション内のテキストを表示したいだけの場合、これは特に役立ちます。 その後、テキストをテキスト文書、XLS、またはJSONとしてダウンロードすることもできます。

画像をテキストに変換する方法: 図4

IronOCRの始め方

IronOCRは、画像にOCR操作を行うための多用途な.NETライブラリです。 豊富な機能を提供し、PNG、JPEG、TIFF、PDFなどのさまざまなファイル形式を処理し、画像補正、特殊なドキュメントのスキャン(パスポート、ナンバープレートなど)、スキャンされたファイルに関する高度な情報の提供、スキャンされたドキュメントの変換、テキストのハイライトを行うことができます。

IronOCRライブラリのインストール

IronOCRを使用して画像を読み取るには、プロジェクトにインストールされていない場合、インストールする必要があります。 Visual StudioのNuGetを使用して簡単にIronOCRをインストールできます。 NuGetパッケージマネージャーコンソールを開き、次のコマンドを実行します。

Install-Package IronOcr

または、SolutionページのNuGetパッケージマネージャーを使用してIronOCRを検索し、インストールすることもできます。

画像をテキストに変換する方法: 図5

IronOCRをコードで使用するには、コードの冒頭に適切なインポート文を入れておくことを確認してください:

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

画像をテキストに変換: 基本例

まず、IronOCRを使用した基本的な画像からテキストへの例を見てみましょう。 これはどのOCRツールでも基本機能であり、この例では、オンラインツールで使用したPNGファイルを使用します。 この例では、まずIronTesseractクラスをインスタンス化し、変数ocrに割り当てました。 次に、OcrImageInputクラスを使用して、提供された画像ファイルから新しいOcrImageInputオブジェクトを作成します。 最後に、Readメソッドを使用して画像からテキストを読み取り、OcrResultオブジェクトを返します。 ocrResult.Textを使用して抽出されたテキストにアクセスし、コンソールに表示することができます。

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load the image from which to extract text
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

出力画像

画像をテキストに変換する方法: 図6

異なる画像形式の処理

IronOCRは、PNG、JPEG、BMP、GIF、TIFFなどの複数の画像形式をサポートしています。 異なる画像形式からテキストを読むプロセスは同じで、正しい拡張子でファイルを読み込むだけです。

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load a BMP image
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

OCR精度の向上

画像を最適化し、言語、画像解像度、画像のノイズのレベルなどのオプションを設定することで、OCRのパフォーマンスを向上させることができます。 DeNoise()およびSharpen()メソッドを使用して、品質を改善する必要がある画像でのテキスト抽出の精度を向上させるためにOCRを微調整する方法を紹介します。

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load the image and apply image processing to improve accuracy
Private OcrImageInput As using
image.DeNoise()
image.Sharpen()

' Perform OCR to extract text
Dim ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

抽出されたテキストのエクスポート

画像からテキストへの変換プロセスの基本を理解したので、今度は生成されたテキストを後で使用するためにエクスポートする方法を見てみましょう。 この例では、前と同じプロセスを使って画像を読み込み、スキャンします。 次に、File.WriteAllText("output.txt", ocrResult.Text)を使用して、output.txtという新しいテキストファイルを作成し、抽出されたテキストをファイルに保存します。

using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Imports System.IO

Private ocr As New IronTesseract()

' Load the image
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text)
$vbLabelText   $csharpLabel

画像をテキストに変換する方法: 図7

IronOCRの主な特徴

  1. 高精度: IronOCRは、Tesseractの高度なOCRアルゴリズムと、複雑な画像を処理するための組み込みツールを使用し、高い精度を保証します。
  2. 多言語対応: 125以上の言語をサポートし、ラテン、キリル、アラビア、アジアの文字など多くの書記体系を含みます。 ただし、IronOCRと一緒にインストールされるのは英語のみであることに注意してください。 他の言語を使用するには、その言語の追加言語パックをインストールする必要があります。
  3. PDF OCR: IronOCRは、スキャンされたPDFからテキストを抽出でき、ドキュメントのデジタル化に役立ちます。
  4. 画像クリーンアップ: プリプロセッシングツールとして、デスキューノイズ除去反転を提供し、画像の品質を改善してOCRの精度を向上させることができます。
  5. 簡単な統合: このAPIは、コンソールアプリケーション、ウェブアプリケーション、デスクトップソフトウェアのいずれであっても、.NETプロジェクトにシームレスに統合します。

画像をテキストに変換する一般的なユースケース

  • データ入力の自動化: 企業はOCRを使用して、フォーム、領収書、名刺から自動的にデータを抽出できます。
  • ドキュメントアーカイブ: 組織は物理ドキュメントをデジタル化し、検索可能で保存しやすくします。
  • アクセシビリティ: 印刷物をテキストに変換して、スクリーンリーダーやその他の支援技術で使用する。
  • 研究と分析: スキャンした研究資料を迅速にテキストに変換し、分析や他のソフトウェアツールへの統合に利用。
  • 学習: スキャンした学習ノートを編集可能なテキストに変換し、その後IronWordやMicrosoft Word、Google docsなどのツールでさらに操作するためにWord文書として保存。

結論

IronOCRを使用して画像からテキストを変換することは、ドキュメント処理タスクを処理するための迅速かつ正確で効率的な方法です。 スキャンしたドキュメント、デジタル画像、PDFドキュメントを使用しているかにかかわらず、IronOCRはプロセスを簡素化し、高精度、多言語対応、強力な画像処理ツールを提供します。 このツールは、ドキュメント管理ワークフローの合理化、データ抽出の自動化、またはアクセシビリティの向上を目指している企業に最適です。

無料トライアルを利用して、IronOCRの強力な機能を実際に試してみてください。 完全に動作するようにするには数分しかかからず、すぐにOCRタスクを処理を開始できます!

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。