フッターコンテンツにスキップ
OCRツール

画像をテキストに変換する方法

現在のデジタル時代では、画像ベースのコンテンツを読みやすく、編集可能で、検索可能なテキストに変換することが重要です。 これは、紙ベースの文書のアーカイブ、画像からの重要な情報の抽出、印刷物のデジタル化などのシナリオで特に重要です。 光学文字認識 (OCR) テクノロジは、この変換プロセスを自動化するソリューションを提供します。 これを実現するための信頼性が高く効率的なツールの 1 つが、.NET 用の堅牢な OCR ライブラリであるIronOCRです。

この記事では、 IronOCRを使用して画像をテキストに変換する方法と、この変換によって時間を節約し、エラーを減らし、データの抽出、アーカイブ、ドキュメント処理などのプロセスを効率化できる方法について説明します。

画像をテキストに変換する方法

  1. OCR作業用のC#ライブラリをダウンロードする
  2. 新しいIronTesseractインスタンスを作成する
  3. OcrImageInputを使用して画像を読み込む
  4. OcrReadを使用して画像の内容を読み取る
  5. OCR結果をテキストファイルにエクスポートする

画像をテキストに変換する理由

画像をテキストに変換する理由は、次のようなものが考えられます。

*データ抽出:*アーカイブまたはデータ処理の目的で、スキャンされたドキュメントや画像からテキストを抽出します。 スキャンしたコンテンツの編集:以前にスキャンしたドキュメントのテキストを編集または更新して、コンテンツを手動で再入力する時間を節約します。 アクセシビリティの向上:印刷された資料をデジタル テキストに変換し、スクリーン リーダーや音声合成アプリケーションでアクセスできるようにします。 自動化:**請求書、領収書、名刺からテキストを読み取って、データの入力と処理を自動化します。

画像をテキストに変換する方法

IronOCR の強力な画像テキスト変換機能を活用して画像からテキストを抽出する方法を検討する前に、まずオンライン ツールDocsumoを使用して一般的な手順を順に見ていきましょう。 オンラインOCRツールは、手動設定が不要なため、ちょっとしたOCR作業や単発のOCR作業を行いたい方にとって便利な選択肢です。もちろん、OCR作業を定期的に行う必要がある場合は、IronOCRのような強力なOCRツールの方が適しているかもしれません。

  1. オンラインOCRツールへ移動
  2. 画像をアップロードして抽出プロセスを開始します
  3. 結果データをテキスト文書としてダウンロードする

ステップ1: オンラインOCRツールに移動する

OCR テクノロジーを利用して画像ファイルからテキストを抽出するには、まず使用したいオンライン画像 OCR ツールに移動します。

画像をテキストに変換する方法:図1 - Docsumo OCRツール

ステップ2:画像をアップロードして抽出プロセスを開始する

ここで、"ファイルのアップロード"ボタンをクリックすると、テキストを抽出する画像ファイルをアップロードできます。 ツールはすぐに画像の処理を開始します。

画像をテキストに変換する方法:図2 - Docsumo - ファイル処理

ステップ3: 結果データをテキストドキュメントとしてダウンロードする

画像の処理が完了したら、抽出したテキストを新しいテキスト ドキュメントとしてダウンロードし、さらに使用したり操作したりすることができます。

画像をテキストに変換する方法:図3 - Docsumo - 画像処理完了

ファイルを表示し、さまざまなセクションを強調表示して、そこに含まれるテキストを表示することもできます。 これは、特定のセクション内のテキストのみを表示したい場合に特に役立ちます。 その後、テキストをテキスト ドキュメント、XLS、または JSON としてダウンロードできます。

画像をテキストに変換する方法:図4

IronOCRを使い始める

IronOCR は、画像に対して OCR 操作を実行できる多目的の .NET ライブラリです。 幅広い機能を備えており、さまざまなファイル形式 (PNG、JPEG、TIFF、PDF など) を処理したり、画像補正を実行したり、特殊な文書 (パスポート、ナンバープレートなど) をスキャンしたり、スキャンしたファイルに関する詳細情報を提供したり、スキャンした文書を変換したり、テキストを強調表示したりできます。

IronOCRライブラリをインストールする

IronOCR を使用して画像の読み取りを開始する前に、プロジェクトにまだインストールされていない場合はインストールする必要があります。 Visual Studio で NuGet を使用して IronOCR を簡単にインストールできます。 NuGetパッケージマネージャーコンソールを開き、次のコマンドを実行します。

Install-Package IronOcr

あるいは、IronOCR を検索して、ソリューションの NuGet パッケージ マネージャー ページから IronOCR をインストールすることもできます。

画像をテキストに変換する方法:図5

コード内で IronOCR を使用するには、コードの先頭に適切なインポート ステートメントがあることを確認してください。

using IronOcr;
using IronOcr;
$vbLabelText   $csharpLabel

画像をテキストに変換する: 基本的な例

まず、IronOCR を使用した画像からテキストへの基本的な例を見てみましょう。 これはあらゆる OCR ツールのコア機能であり、この例では、オンライン ツールで使用した PNG ファイルを使用します。 この例では、最初にIronTesseractクラスをインスタンス化し、それに変数ocrを割り当てています。 次に、 OcrImageInputクラスを使用して、提供された画像ファイルから新しい OcrImageInput オブジェクトを作成します。 最後に、 Readメソッドを使用して画像からテキストを読み取り、 OcrResultオブジェクトを返します。 その後、抽出されたテキストにアクセスし、 ocrResult.Textを使用してコンソールに表示できます。

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
$vbLabelText   $csharpLabel

出力画像

画像をテキストに変換する方法:図6

さまざまな画像形式の処理

IronOCR は、PNG、JPEG、BMP、GIF、TIFF などの複数の画像形式をサポートしています。 さまざまな画像形式からテキストを読み取るプロセスは同じままで、正しい拡張子のファイルを読み込むだけです。

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
$vbLabelText   $csharpLabel

OCR精度の向上

画像を最適化し、言語、画像解像度、画像内のノイズ レベルなどのオプションを構成することで、OCR のパフォーマンスを向上させることができます。 DeNoise()Sharpen()メソッドを使用して、品質の向上が必要な画像上のテキスト抽出の精度を高めるために OCR を微調整する方法を次に示します。

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
$vbLabelText   $csharpLabel

抽出したテキストのエクスポート

画像からテキストへのプロセスの基本がわかったので、結果のテキストを後で使用するためにエクスポートする方法を見てみましょう。 この例では、前と同じプロセスを使用して画像を読み込んでスキャンします。 次に、 File.WriteAllText("output.txt", ocrResult.Text)を使用して、 output.txtという新しいテキスト ファイルを作成し、抽出したテキストをそのファイルに保存します。

using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
$vbLabelText   $csharpLabel

画像をテキストに変換する方法:図7

IronOCRの主な機能

1.高精度: IronOCR は高度なTesseract OCR アルゴリズムを使用し、複雑な画像を処理するためのツールを内蔵しているため、高い精度が保証されます。 2.多言語サポート:ラテン文字、キリル文字、アラビア文字、アジア文字などの複数の表記法を含む125 以上の言語をサポートします。 ただし、IronOCR と一緒にインストールされるのは英語のみであることに注意してください。 他の言語を使用するには、その言語の追加言語パックをインストールする必要があります。

  1. PDF OCR: IronOCR はスキャンされた PDFからテキストを抽出できるため、ドキュメントのデジタル化に役立つツールとなります。 4.画像のクリーンアップ:歪み補正ノイズ除去反転などの前処理ツールを提供して画像品質を改善し、OCR の精度を向上させます。 5.簡単な統合: API は、コンソール アプリ、Web アプリ、デスクトップ ソフトウェアなど、あらゆる .NET プロジェクトとシームレスに統合されます。

画像をテキストに変換する一般的な使用例

*データ入力の自動化:*企業は OCR を使用して、フォーム、領収書、名刺からデータを自動的に抽出できます。 ドキュメントのアーカイブ:組織は物理的なドキュメントをデジタル化することで、検索しやすく、保管しやすくなります。 アクセシビリティ:スクリーン リーダーやその他の支援技術で使用できるように、印刷された資料をテキストに変換します。 調査と分析:**スキャンした調査資料をすぐにテキストに変換して、分析したり、他のソフトウェア ツールに統合したりできます。 *学習:スキャンした学習ノートを編集可能なテキストに変換し、Word 文書として保存して、IronWord、Microsoft Word、Google ドキュメントなどのツールでさらに操作することができます。

結論

IronOCR を使用して画像からテキストを変換することは、ドキュメント処理タスクを処理するための高速、正確、かつ効率的な方法です。 スキャンした文書、デジタル画像、PDF 文書のいずれを扱う場合でも、IronOCR はプロセスを簡素化し、高精度、多言語サポート、強力な画像処理ツールを提供します。 このツールは、ドキュメント管理ワークフローの合理化、データ抽出の自動化、アクセシビリティの向上を目指す企業に最適です。

今すぐ無料トライアルを利用して、IronOCR の強力な機能をお試しください。 ワークスペース内で完全に機能させるには数分しかかからないため、すぐに OCR タスクの処理を開始できます。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。