画像をテキストに変換する方法
現在のデジタル時代では、画像ベースのコンテンツを読みやすく、編集可能で、検索可能なテキストに変換することが重要です。 これは、紙ベースの文書のアーカイブ、画像からの重要な情報の抽出、印刷物のデジタル化などのシナリオで特に重要です。 光学文字認識 (OCR) テクノロジは、この変換プロセスを自動化するソリューションを提供します。 これを実現するための信頼性が高く効率的なツールの 1 つが、.NET 用の堅牢な OCR ライブラリであるIronOCRです。
この記事では、 IronOCRを使用して画像をテキストに変換する方法と、この変換によって時間を節約し、エラーを減らし、データの抽出、アーカイブ、ドキュメント処理などのプロセスを効率化できる方法について説明します。
画像をテキストに変換する方法
- OCR作業用のC#ライブラリをダウンロードする
- 新しい
IronTesseractインスタンスを作成します OcrImageInputを使用して画像を読み込みます。OcrReadを使用して画像の内容を読み取ります。- OCR結果をテキストファイルにエクスポートする
画像をテキストに変換する理由
画像をテキストに変換する理由は、次のようなものが考えられます。
*データ抽出:*アーカイブまたはデータ処理の目的で、スキャンされたドキュメントや画像からテキストを抽出します。 スキャンしたコンテンツの編集:以前にスキャンしたドキュメントのテキストを編集または更新して、コンテンツを手動で再入力する時間を節約します。 アクセシビリティの向上:印刷された資料をデジタル テキストに変換し、スクリーン リーダーや音声合成アプリケーションでアクセスできるようにします。 自動化:**請求書、領収書、名刺からテキストを読み取って、データの入力と処理を自動化します。
画像をテキストに変換する方法
IronOCR の強力な画像テキスト変換機能を活用して画像からテキストを抽出する方法を検討する前に、まずオンライン ツールDocsumoを使用して一般的な手順を順に見ていきましょう。 オンラインOCRツールは、手動設定が不要なため、ちょっとしたOCR作業や単発のOCR作業を行いたい方にとって便利な選択肢です。もちろん、OCR作業を定期的に行う必要がある場合は、IronOCRのような強力なOCRツールの方が適しているかもしれません。
- オンラインOCRツールへ移動
- 画像をアップロードして抽出プロセスを開始します
- 結果データをテキスト文書としてダウンロードする
ステップ1: オンラインOCRツールに移動する
OCR テクノロジーを利用して画像ファイルからテキストを抽出するには、まず使用したいオンライン画像 OCR ツールに移動します。

ステップ2:画像をアップロードして抽出プロセスを開始する
ここで、"ファイルのアップロード"ボタンをクリックすると、テキストを抽出する画像ファイルをアップロードできます。 ツールはすぐに画像の処理を開始します。

ステップ3: 結果データをテキストドキュメントとしてダウンロードする
画像の処理が完了したら、抽出したテキストを新しいテキスト ドキュメントとしてダウンロードし、さらに使用したり操作したりすることができます。

ファイルを表示し、さまざまなセクションを強調表示して、そこに含まれるテキストを表示することもできます。 これは、特定のセクション内のテキストのみを表示したい場合に特に役立ちます。 その後、テキストをテキスト ドキュメント、XLS、または JSON としてダウンロードできます。

IronOCRを使い始める
IronOCR は、画像に対して OCR 操作を実行できる多目的の .NET ライブラリです。 幅広い機能を備えており、さまざまなファイル形式 (PNG、JPEG、TIFF、PDF など) を処理したり、画像補正を実行したり、特殊な文書 (パスポート、ナンバープレートなど) をスキャンしたり、スキャンしたファイルに関する詳細情報を提供したり、スキャンした文書を変換したり、テキストを強調表示したりできます。
IronOCRライブラリをインストールする
IronOCR を使用して画像の読み取りを開始する前に、プロジェクトにまだインストールされていない場合はインストールする必要があります。 Visual Studio で NuGet を使用して IronOCR を簡単にインストールできます。 NuGetパッケージマネージャーコンソールを開き、次のコマンドを実行します。
Install-Package IronOcr
あるいは、IronOCR を検索して、ソリューションの NuGet パッケージ マネージャー ページから IronOCR をインストールすることもできます。

コード内で IronOCR を使用するには、コードの先頭に適切なインポート ステートメントがあることを確認してください。
using IronOcr;
using IronOcr;
Imports IronOcr
画像をテキストに変換する: 基本的な例
まず、IronOCR を使用した画像からテキストへの基本的な例を見てみましょう。 これはあらゆる OCR ツールのコア機能であり、この例では、オンライン ツールで使用した PNG ファイルを使用します。 この例では、まず IronTesseract クラスをインスタンス化し、変数 ocr を割り当てました。 次に、OcrImageInput クラスを使用して、提供された画像ファイルから新しい OcrImageInput オブジェクトを作成します。 最後に、Read メソッドを使用して画像からテキストを読み取り、OcrResult オブジェクトを返します。 抽出したテキストにアクセスして、ocrResult.Text を使用してコンソールに表示できます。
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
' Load the image from which to extract text
Private OcrImageInput As using
' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)
' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
出力画像

さまざまな画像形式の処理
IronOCR は、PNG、JPEG、BMP、GIF、TIFF などの複数の画像形式をサポートしています。 さまざまな画像形式からテキストを読み取るプロセスは同じままで、正しい拡張子のファイルを読み込むだけです。
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
' Load a BMP image
Private OcrImageInput As using
' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)
' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
OCR精度の向上
画像を最適化し、言語、画像解像度、画像内のノイズ レベルなどのオプションを構成することで、OCR のパフォーマンスを向上させることができます。 DeNoise() および Sharpen() メソッドを使用して、画質を改善して画像からのテキスト抽出の精度を高めるために OCR を微調整する方法は次のとおりです。
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
' Load the image and apply image processing to improve accuracy
Private OcrImageInput As using
image.DeNoise()
image.Sharpen()
' Perform OCR to extract text
Dim ocrResult As OcrResult = ocr.Read(image)
' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
抽出したテキストのエクスポート
画像からテキストへのプロセスの基本がわかったので、結果のテキストを後で使用するためにエクスポートする方法を見てみましょう。 この例では、前と同じプロセスを使用して画像を読み込んでスキャンします。 次に、File.WriteAllText("output.txt", ocrResult.Text) を使用して、output.txt という名前の新しいテキスト ファイルを作成し、抽出したテキストをそのファイルに保存します。
using IronOcr;
using System.IO;
IronTesseract ocr = new IronTesseract();
// Load the image
using OcrImageInput image = new OcrImageInput("example.png");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
using System.IO;
IronTesseract ocr = new IronTesseract();
// Load the image
using OcrImageInput image = new OcrImageInput("example.png");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Imports System.IO
Private ocr As New IronTesseract()
' Load the image
Private OcrImageInput As using
' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)
' Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text)

IronOCRの主な機能
1.高精度: IronOCRは高度なTesseract OCRアルゴリズムを使用し、複雑な画像を処理するための組み込みツールを備えているため、高い精度が保証されます。 2.多言語対応:ラテン文字、キリル文字、アラビア文字、アジア文字など、複数の文字体系を含む125以上の言語に対応しています。 ただし、IronOCR と一緒にインストールされるのは英語のみであることに注意してください。 他の言語を使用するには、その言語の追加言語パックをインストールする必要があります。
- PDF OCR: IronOCRはスキャンされたPDFからテキストを抽出できるため、文書のデジタル化に役立つツールです。 4.画像クリーンアップ: OCRの精度を向上させるために、画像の歪み補正、 ノイズ除去、反転などの前処理ツールを提供し、画像の品質を改善します。 5.簡単な統合:このAPIは、コンソールアプリ、Webアプリ、デスクトップソフトウェアなど、あらゆる.NETプロジェクトとシームレスに統合できます。
画像をテキストに変換する一般的な使用例
*データ入力の自動化:*企業はOCRを使用して、フォーム、領収書、名刺からデータを自動的に抽出できます。 文書アーカイブ:組織は紙の文書をデジタル化することで、検索しやすく、保管しやすくすることができます。 アクセシビリティ:印刷物をテキストに変換し、スクリーンリーダーやその他の支援技術で使用できるようにする。 調査と分析:**スキャンした調査資料を迅速にテキストに変換し、分析したり、他のソフトウェアツールに統合したりできます。 *学習:スキャンした学習ノートを編集可能なテキストに変換し、Word 文書として保存して、IronWord、Microsoft Word、Google ドキュメントなどのツールでさらに操作することができます。
結論
IronOCR を使用して画像からテキストを変換することは、ドキュメント処理タスクを処理するための高速、正確、かつ効率的な方法です。 スキャンした文書、デジタル画像、PDF 文書のいずれを扱う場合でも、IronOCR はプロセスを簡素化し、高精度、多言語サポート、強力な画像処理ツールを提供します。 このツールは、ドキュメント管理ワークフローの合理化、データ抽出の自動化、アクセシビリティの向上を目指す企業に最適です。
今すぐ無料トライアルを利用して、IronOCR の強力な機能をお試しください。 ワークスペース内で完全に機能させるには数分しかかからないため、すぐに OCR タスクの処理を開始できます。




