OCRツール 画像をテキストに変換する方法 Kannapat Udonpant 更新日:2025年6月22日 IronOCR をダウンロード NuGet ダウンロード DLL ダウンロード Windows 版 無料トライアル LLM向けのコピー LLM向けのコピー LLM 用の Markdown としてページをコピーする ChatGPTで開く このページについてChatGPTに質問する ジェミニで開く このページについてGeminiに問い合わせる Grokで開く このページについてGrokに質問する 困惑の中で開く このページについてPerplexityに問い合わせる 共有する Facebook で共有 Xでシェア(Twitter) LinkedIn で共有 URLをコピー 記事をメールで送る 現在のデジタル時代では、画像ベースのコンテンツを読みやすく、編集可能で、検索可能なテキストに変換することが重要です。 これは、紙ベースの文書のアーカイブ、画像からの重要な情報の抽出、印刷物のデジタル化などのシナリオで特に重要です。 光学文字認識 (OCR) テクノロジは、この変換プロセスを自動化するソリューションを提供します。 これを実現するための信頼性が高く効率的なツールの 1 つが、.NET 用の堅牢な OCR ライブラリであるIronOCRです。 この記事では、 IronOCRを使用して画像をテキストに変換する方法と、この変換によって時間を節約し、エラーを減らし、データの抽出、アーカイブ、ドキュメント処理などのプロセスを効率化できる方法について説明します。 画像をテキストに変換する方法 OCR作業用のC#ライブラリをダウンロードする 新しいIronTesseractインスタンスを作成する OcrImageInputを使用して画像を読み込む OcrReadを使用して画像の内容を読み取る OCR結果をテキストファイルにエクスポートする 画像をテキストに変換する理由 画像をテキストに変換する理由は、次のようなものが考えられます。 *データ抽出:*アーカイブまたはデータ処理の目的で、スキャンされたドキュメントや画像からテキストを抽出します。 スキャンしたコンテンツの編集:以前にスキャンしたドキュメントのテキストを編集または更新して、コンテンツを手動で再入力する時間を節約します。 アクセシビリティの向上:印刷された資料をデジタル テキストに変換し、スクリーン リーダーや音声合成アプリケーションでアクセスできるようにします。 自動化:**請求書、領収書、名刺からテキストを読み取って、データの入力と処理を自動化します。 画像をテキストに変換する方法 IronOCR の強力な画像テキスト変換機能を活用して画像からテキストを抽出する方法を検討する前に、まずオンライン ツールDocsumoを使用して一般的な手順を順に見ていきましょう。 オンラインOCRツールは、手動設定が不要なため、ちょっとしたOCR作業や単発のOCR作業を行いたい方にとって便利な選択肢です。もちろん、OCR作業を定期的に行う必要がある場合は、IronOCRのような強力なOCRツールの方が適しているかもしれません。 オンラインOCRツールへ移動 画像をアップロードして抽出プロセスを開始します 結果データをテキスト文書としてダウンロードする ステップ1: オンラインOCRツールに移動する OCR テクノロジーを利用して画像ファイルからテキストを抽出するには、まず使用したいオンライン画像 OCR ツールに移動します。 画像をテキストに変換する方法:図1 - Docsumo OCRツール ステップ2:画像をアップロードして抽出プロセスを開始する ここで、"ファイルのアップロード"ボタンをクリックすると、テキストを抽出する画像ファイルをアップロードできます。 ツールはすぐに画像の処理を開始します。 画像をテキストに変換する方法:図2 - Docsumo - ファイル処理 ステップ3: 結果データをテキストドキュメントとしてダウンロードする 画像の処理が完了したら、抽出したテキストを新しいテキスト ドキュメントとしてダウンロードし、さらに使用したり操作したりすることができます。 画像をテキストに変換する方法:図3 - Docsumo - 画像処理完了 ファイルを表示し、さまざまなセクションを強調表示して、そこに含まれるテキストを表示することもできます。 これは、特定のセクション内のテキストのみを表示したい場合に特に役立ちます。 その後、テキストをテキスト ドキュメント、XLS、または JSON としてダウンロードできます。 画像をテキストに変換する方法:図4 IronOCRを使い始める IronOCR は、画像に対して OCR 操作を実行できる多目的の .NET ライブラリです。 幅広い機能を備えており、さまざまなファイル形式 (PNG、JPEG、TIFF、PDF など) を処理したり、画像補正を実行したり、特殊な文書 (パスポート、ナンバープレートなど) をスキャンしたり、スキャンしたファイルに関する詳細情報を提供したり、スキャンした文書を変換したり、テキストを強調表示したりできます。 IronOCRライブラリをインストールする IronOCR を使用して画像の読み取りを開始する前に、プロジェクトにまだインストールされていない場合はインストールする必要があります。 Visual Studio で NuGet を使用して IronOCR を簡単にインストールできます。 NuGetパッケージマネージャーコンソールを開き、次のコマンドを実行します。 Install-Package IronOcr あるいは、IronOCR を検索して、ソリューションの NuGet パッケージ マネージャー ページから IronOCR をインストールすることもできます。 画像をテキストに変換する方法:図5 コード内で IronOCR を使用するには、コードの先頭に適切なインポート ステートメントがあることを確認してください。 using IronOcr; using IronOcr; Imports IronOcr $vbLabelText $csharpLabel 画像をテキストに変換する: 基本的な例 まず、IronOCR を使用した画像からテキストへの基本的な例を見てみましょう。 これはあらゆる OCR ツールのコア機能であり、この例では、オンライン ツールで使用した PNG ファイルを使用します。 この例では、最初にIronTesseractクラスをインスタンス化し、それに変数ocrを割り当てています。 次に、 OcrImageInputクラスを使用して、提供された画像ファイルから新しい OcrImageInput オブジェクトを作成します。 最後に、 Readメソッドを使用して画像からテキストを読み取り、 OcrResultオブジェクトを返します。 その後、抽出されたテキストにアクセスし、 ocrResult.Textを使用してコンソールに表示できます。 using IronOcr; IronTesseract ocr = new IronTesseract(); // Load the image from which to extract text using OcrImageInput image = new OcrImageInput("example.png"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); using IronOcr; IronTesseract ocr = new IronTesseract(); // Load the image from which to extract text using OcrImageInput image = new OcrImageInput("example.png"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); Imports IronOcr Private ocr As New IronTesseract() ' Load the image from which to extract text Private OcrImageInput As using ' Perform OCR to extract text Private ocrResult As OcrResult = ocr.Read(image) ' Output the extracted text to the console Console.WriteLine(ocrResult.Text) $vbLabelText $csharpLabel 出力画像 画像をテキストに変換する方法:図6 さまざまな画像形式の処理 IronOCR は、PNG、JPEG、BMP、GIF、TIFF などの複数の画像形式をサポートしています。 さまざまな画像形式からテキストを読み取るプロセスは同じままで、正しい拡張子のファイルを読み込むだけです。 using IronOcr; IronTesseract ocr = new IronTesseract(); // Load a BMP image using OcrImageInput image = new OcrImageInput("example.bmp"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); using IronOcr; IronTesseract ocr = new IronTesseract(); // Load a BMP image using OcrImageInput image = new OcrImageInput("example.bmp"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); Imports IronOcr Private ocr As New IronTesseract() ' Load a BMP image Private OcrImageInput As using ' Perform OCR to extract text Private ocrResult As OcrResult = ocr.Read(image) ' Output the extracted text to the console Console.WriteLine(ocrResult.Text) $vbLabelText $csharpLabel OCR精度の向上 画像を最適化し、言語、画像解像度、画像内のノイズ レベルなどのオプションを構成することで、OCR のパフォーマンスを向上させることができます。 DeNoise()とSharpen()メソッドを使用して、品質の向上が必要な画像上のテキスト抽出の精度を高めるために OCR を微調整する方法を次に示します。 using IronOcr; IronTesseract ocr = new IronTesseract(); // Load the image and apply image processing to improve accuracy using OcrImageInput image = new OcrImageInput("example.png"); image.DeNoise(); image.Sharpen(); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); using IronOcr; IronTesseract ocr = new IronTesseract(); // Load the image and apply image processing to improve accuracy using OcrImageInput image = new OcrImageInput("example.png"); image.DeNoise(); image.Sharpen(); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); Imports IronOcr Private ocr As New IronTesseract() ' Load the image and apply image processing to improve accuracy Private OcrImageInput As using image.DeNoise() image.Sharpen() ' Perform OCR to extract text Dim ocrResult As OcrResult = ocr.Read(image) ' Output the extracted text to the console Console.WriteLine(ocrResult.Text) $vbLabelText $csharpLabel 抽出したテキストのエクスポート 画像からテキストへのプロセスの基本がわかったので、結果のテキストを後で使用するためにエクスポートする方法を見てみましょう。 この例では、前と同じプロセスを使用して画像を読み込んでスキャンします。 次に、 File.WriteAllText("output.txt", ocrResult.Text)を使用して、 output.txtという新しいテキスト ファイルを作成し、抽出したテキストをそのファイルに保存します。 using IronOcr; using System.IO; IronTesseract ocr = new IronTesseract(); // Load the image using OcrImageInput image = new OcrImageInput("example.png"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Save the extracted text to a file File.WriteAllText("output.txt", ocrResult.Text); using IronOcr; using System.IO; IronTesseract ocr = new IronTesseract(); // Load the image using OcrImageInput image = new OcrImageInput("example.png"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Save the extracted text to a file File.WriteAllText("output.txt", ocrResult.Text); Imports IronOcr Imports System.IO Private ocr As New IronTesseract() ' Load the image Private OcrImageInput As using ' Perform OCR to extract text Private ocrResult As OcrResult = ocr.Read(image) ' Save the extracted text to a file File.WriteAllText("output.txt", ocrResult.Text) $vbLabelText $csharpLabel 画像をテキストに変換する方法:図7 IronOCRの主な機能 1.高精度: IronOCR は高度なTesseract OCR アルゴリズムを使用し、複雑な画像を処理するためのツールを内蔵しているため、高い精度が保証されます。 2.多言語サポート:ラテン文字、キリル文字、アラビア文字、アジア文字などの複数の表記法を含む125 以上の言語をサポートします。 ただし、IronOCR と一緒にインストールされるのは英語のみであることに注意してください。 他の言語を使用するには、その言語の追加言語パックをインストールする必要があります。 PDF OCR: IronOCR はスキャンされた PDFからテキストを抽出できるため、ドキュメントのデジタル化に役立つツールとなります。 4.画像のクリーンアップ:歪み補正、 ノイズ除去、反転などの前処理ツールを提供して画像品質を改善し、OCR の精度を向上させます。 5.簡単な統合: API は、コンソール アプリ、Web アプリ、デスクトップ ソフトウェアなど、あらゆる .NET プロジェクトとシームレスに統合されます。 画像をテキストに変換する一般的な使用例 *データ入力の自動化:*企業は OCR を使用して、フォーム、領収書、名刺からデータを自動的に抽出できます。 ドキュメントのアーカイブ:組織は物理的なドキュメントをデジタル化することで、検索しやすく、保管しやすくなります。 アクセシビリティ:スクリーン リーダーやその他の支援技術で使用できるように、印刷された資料をテキストに変換します。 調査と分析:**スキャンした調査資料をすぐにテキストに変換して、分析したり、他のソフトウェア ツールに統合したりできます。 *学習:スキャンした学習ノートを編集可能なテキストに変換し、Word 文書として保存して、IronWord、Microsoft Word、Google ドキュメントなどのツールでさらに操作することができます。 結論 IronOCR を使用して画像からテキストを変換することは、ドキュメント処理タスクを処理するための高速、正確、かつ効率的な方法です。 スキャンした文書、デジタル画像、PDF 文書のいずれを扱う場合でも、IronOCR はプロセスを簡素化し、高精度、多言語サポート、強力な画像処理ツールを提供します。 このツールは、ドキュメント管理ワークフローの合理化、データ抽出の自動化、アクセシビリティの向上を目指す企業に最適です。 今すぐ無料トライアルを利用して、IronOCR の強力な機能をお試しください。 ワークスペース内で完全に機能させるには数分しかかからないため、すぐに OCR タスクの処理を開始できます。 Kannapat Udonpant 今すぐエンジニアリングチームとチャット ソフトウェアエンジニア ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。 関連する記事 更新日 2025年6月22日 Power Automate OCR(開発者向けチュートリアル) この光学文字認識技術は、ドキュメントのデジタル化、自動化されたPDFデータの抽出とエントリ、請求書処理、スキャンPDFの検索可能化に応用されます。 詳しく読む 更新日 2025年6月22日 Easyocr対Tesseract (OCR機能の比較) EasyOCR、Tesseract OCR、Keras-OCR、IronOCRのような人気のOCRツールやライブラリは、現代のアプリケーションにこの機能を統合するためによく利用されています。 詳しく読む 更新日 2025年6月22日 レシートOCRライブラリ(開発者向けリスト) これらのレシートOCR APIライブラリは、強力なレシート機能をシームレスに.NETアプリケーションに統合し、データ管理ワークフローを革新するために開発者を支援します。 詳しく読む Easyocr対Tesseract (OCR機能の比較)レシートOCRライブラリ(...
更新日 2025年6月22日 Power Automate OCR(開発者向けチュートリアル) この光学文字認識技術は、ドキュメントのデジタル化、自動化されたPDFデータの抽出とエントリ、請求書処理、スキャンPDFの検索可能化に応用されます。 詳しく読む
更新日 2025年6月22日 Easyocr対Tesseract (OCR機能の比較) EasyOCR、Tesseract OCR、Keras-OCR、IronOCRのような人気のOCRツールやライブラリは、現代のアプリケーションにこの機能を統合するためによく利用されています。 詳しく読む
更新日 2025年6月22日 レシートOCRライブラリ(開発者向けリスト) これらのレシートOCR APIライブラリは、強力なレシート機能をシームレスに.NETアプリケーションに統合し、データ管理ワークフローを革新するために開発者を支援します。 詳しく読む