OCRツール 画像をテキストに変換する方法 Kannapat Udonpant 更新日:6月 22, 2025 IronOCR をダウンロード NuGet ダウンロード DLL ダウンロード Windows 版 無料トライアル LLM向けのコピー LLM向けのコピー LLM 用の Markdown としてページをコピーする ChatGPTで開く このページについてChatGPTに質問する ジェミニで開く このページについてGeminiに問い合わせる ジェミニで開く このページについてGeminiに問い合わせる 困惑の中で開く このページについてPerplexityに問い合わせる 共有する Facebook で共有 Xでシェア(Twitter) LinkedIn で共有 URLをコピー 記事をメールで送る 現在のデジタル時代では、画像ベースのコンテンツを読みやすく、編集可能で、検索可能なテキストに変換することが重要です。 これは特に、紙ベースのドキュメントのアーカイブ、画像からの重要な情報の抽出、印刷物のデジタル化のシナリオで重要です。 光学文字認識(OCR)技術は、この変換プロセスを自動化するための解決策を提供します。 これを実現するための高信頼で効率的なツールのひとつが、.NETのための強力なOCRライブラリであるIronOCRです。 この記事では、IronOCRを使用して画像をテキストに変換する方法を説明し、この変換がどのように時間を節約し、エラーを減らし、データ抽出、アーカイブ、ドキュメント処理のようなプロセスを合理化するかを探ります。 画像をテキストに変換する方法 OCR作業用のC#ライブラリをダウンロード 新しいIronTesseractインスタンスを作成 OcrImageInputを使用して画像を読み込む OcrReadを使用して画像の内容を読む OCR結果をテキストファイルにエクスポート 画像をテキストに変換する理由 画像をテキストに変換したい理由はいくつかありますが、以下を含みます: データ抽出:スキャンしたドキュメントや画像からテキストを抽出して、アーカイブやデータ処理用に使用。 スキャンしたコンテンツの編集:以前にスキャンしたドキュメントのテキストを編集または更新し、手動で内容を再入力する時間を節約。 アクセシビリティの向上:印刷物をデジタルテキストに変換し、スクリーンリーダーやテキスト読み上げアプリケーションでの使用を可能に。 自動化:請求書、領収書、名刺からのテキスト読み取りによるデータ入力と処理の自動化。 画像をテキストに変換する方法の開始 IronOCRの強力な画像からテキストへの変換機能を活用して画像からテキストを抽出する方法を探る前に、まずオンラインツールを使用する一般的なプロセスを見てみましょう。Docsumoです。 手動でのセットアップが不要であるため、カジュアルまたは一度きりのOCRタスクを行う人にとってはオンラインOCRツールは便利なオプションです。当然ながら、定期的にOCRタスクを行う必要がある場合は、IronOCRのような強力なOCRツールがより適しているかもしれません。 オンラインOCRツールに移動 画像をアップロードして抽出プロセスを開始 生成されたデータをテキスト文書としてダウンロード ステップ1: オンラインOCRツールに移動 画像ファイルからテキストを抽出するためにOCR技術を使用するには、まず使用したいオンライン画像OCRツールに移動します。 ステップ2: 画像をアップロードして抽出プロセスを開始 "ファイルをアップロード"ボタンをクリックすることで、テキストを抽出したい画像ファイルをアップロードすることができます。 ツールはすぐに画像の処理を開始します。 ステップ3: 結果データをテキスト文書としてダウンロード 画像の処理が完了したので、抽出されたテキストを新しいテキスト文書としてダウンロードし、さらなる処理や操作に使用できます。 ファイルを表示して、さまざまなセクションを強調表示してその中に含まれるテキストを見ることもできます。 特定のセクション内のテキストを表示したいだけの場合、これは特に役立ちます。 その後、テキストをテキスト文書、XLS、またはJSONとしてダウンロードすることもできます。 IronOCRの始め方 IronOCRは、画像にOCR操作を行うための多用途な.NETライブラリです。 豊富な機能を提供し、PNG、JPEG、TIFF、PDFなどのさまざまなファイル形式を処理し、画像補正、特殊なドキュメントのスキャン(パスポート、ナンバープレートなど)、スキャンされたファイルに関する高度な情報の提供、スキャンされたドキュメントの変換、テキストのハイライトを行うことができます。 IronOCRライブラリのインストール IronOCRを使用して画像を読み取るには、プロジェクトにインストールされていない場合、インストールする必要があります。 Visual StudioのNuGetを使用して簡単にIronOCRをインストールできます。 NuGetパッケージマネージャーコンソールを開き、次のコマンドを実行します。 Install-Package IronOcr または、SolutionページのNuGetパッケージマネージャーを使用してIronOCRを検索し、インストールすることもできます。 IronOCRをコードで使用するには、コードの冒頭に適切なインポート文を入れておくことを確認してください: using IronOcr; using IronOcr; Imports IronOcr $vbLabelText $csharpLabel 画像をテキストに変換: 基本例 まず、IronOCRを使用した基本的な画像からテキストへの例を見てみましょう。 これはどのOCRツールでも基本機能であり、この例では、オンラインツールで使用したPNGファイルを使用します。 この例では、まずIronTesseractクラスをインスタンス化し、変数ocrに割り当てました。 次に、OcrImageInputクラスを使用して、提供された画像ファイルから新しいOcrImageInputオブジェクトを作成します。 最後に、Readメソッドを使用して画像からテキストを読み取り、OcrResultオブジェクトを返します。 ocrResult.Textを使用して抽出されたテキストにアクセスし、コンソールに表示することができます。 using IronOcr; IronTesseract ocr = new IronTesseract(); // Load the image from which to extract text using OcrImageInput image = new OcrImageInput("example.png"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); using IronOcr; IronTesseract ocr = new IronTesseract(); // Load the image from which to extract text using OcrImageInput image = new OcrImageInput("example.png"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); Imports IronOcr Private ocr As New IronTesseract() ' Load the image from which to extract text Private OcrImageInput As using ' Perform OCR to extract text Private ocrResult As OcrResult = ocr.Read(image) ' Output the extracted text to the console Console.WriteLine(ocrResult.Text) $vbLabelText $csharpLabel 出力画像 異なる画像形式の処理 IronOCRは、PNG、JPEG、BMP、GIF、TIFFなどの複数の画像形式をサポートしています。 異なる画像形式からテキストを読むプロセスは同じで、正しい拡張子でファイルを読み込むだけです。 using IronOcr; IronTesseract ocr = new IronTesseract(); // Load a BMP image using OcrImageInput image = new OcrImageInput("example.bmp"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); using IronOcr; IronTesseract ocr = new IronTesseract(); // Load a BMP image using OcrImageInput image = new OcrImageInput("example.bmp"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); Imports IronOcr Private ocr As New IronTesseract() ' Load a BMP image Private OcrImageInput As using ' Perform OCR to extract text Private ocrResult As OcrResult = ocr.Read(image) ' Output the extracted text to the console Console.WriteLine(ocrResult.Text) $vbLabelText $csharpLabel OCR精度の向上 画像を最適化し、言語、画像解像度、画像のノイズのレベルなどのオプションを設定することで、OCRのパフォーマンスを向上させることができます。 DeNoise()およびSharpen()メソッドを使用して、品質を改善する必要がある画像でのテキスト抽出の精度を向上させるためにOCRを微調整する方法を紹介します。 using IronOcr; IronTesseract ocr = new IronTesseract(); // Load the image and apply image processing to improve accuracy using OcrImageInput image = new OcrImageInput("example.png"); image.DeNoise(); image.Sharpen(); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); using IronOcr; IronTesseract ocr = new IronTesseract(); // Load the image and apply image processing to improve accuracy using OcrImageInput image = new OcrImageInput("example.png"); image.DeNoise(); image.Sharpen(); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Output the extracted text to the console Console.WriteLine(ocrResult.Text); Imports IronOcr Private ocr As New IronTesseract() ' Load the image and apply image processing to improve accuracy Private OcrImageInput As using image.DeNoise() image.Sharpen() ' Perform OCR to extract text Dim ocrResult As OcrResult = ocr.Read(image) ' Output the extracted text to the console Console.WriteLine(ocrResult.Text) $vbLabelText $csharpLabel 抽出されたテキストのエクスポート 画像からテキストへの変換プロセスの基本を理解したので、今度は生成されたテキストを後で使用するためにエクスポートする方法を見てみましょう。 この例では、前と同じプロセスを使って画像を読み込み、スキャンします。 次に、File.WriteAllText("output.txt", ocrResult.Text)を使用して、output.txtという新しいテキストファイルを作成し、抽出されたテキストをファイルに保存します。 using IronOcr; using System.IO; IronTesseract ocr = new IronTesseract(); // Load the image using OcrImageInput image = new OcrImageInput("example.png"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Save the extracted text to a file File.WriteAllText("output.txt", ocrResult.Text); using IronOcr; using System.IO; IronTesseract ocr = new IronTesseract(); // Load the image using OcrImageInput image = new OcrImageInput("example.png"); // Perform OCR to extract text OcrResult ocrResult = ocr.Read(image); // Save the extracted text to a file File.WriteAllText("output.txt", ocrResult.Text); Imports IronOcr Imports System.IO Private ocr As New IronTesseract() ' Load the image Private OcrImageInput As using ' Perform OCR to extract text Private ocrResult As OcrResult = ocr.Read(image) ' Save the extracted text to a file File.WriteAllText("output.txt", ocrResult.Text) $vbLabelText $csharpLabel IronOCRの主な特徴 高精度: IronOCRは、Tesseractの高度なOCRアルゴリズムと、複雑な画像を処理するための組み込みツールを使用し、高い精度を保証します。 多言語対応: 125以上の言語をサポートし、ラテン、キリル、アラビア、アジアの文字など多くの書記体系を含みます。 ただし、IronOCRと一緒にインストールされるのは英語のみであることに注意してください。 他の言語を使用するには、その言語の追加言語パックをインストールする必要があります。 PDF OCR: IronOCRは、スキャンされたPDFからテキストを抽出でき、ドキュメントのデジタル化に役立ちます。 画像クリーンアップ: プリプロセッシングツールとして、デスキュー、ノイズ除去、反転を提供し、画像の品質を改善してOCRの精度を向上させることができます。 簡単な統合: このAPIは、コンソールアプリケーション、ウェブアプリケーション、デスクトップソフトウェアのいずれであっても、.NETプロジェクトにシームレスに統合します。 画像をテキストに変換する一般的なユースケース データ入力の自動化: 企業はOCRを使用して、フォーム、領収書、名刺から自動的にデータを抽出できます。 ドキュメントアーカイブ: 組織は物理ドキュメントをデジタル化し、検索可能で保存しやすくします。 アクセシビリティ: 印刷物をテキストに変換して、スクリーンリーダーやその他の支援技術で使用する。 研究と分析: スキャンした研究資料を迅速にテキストに変換し、分析や他のソフトウェアツールへの統合に利用。 学習: スキャンした学習ノートを編集可能なテキストに変換し、その後IronWordやMicrosoft Word、Google docsなどのツールでさらに操作するためにWord文書として保存。 結論 IronOCRを使用して画像からテキストを変換することは、ドキュメント処理タスクを処理するための迅速かつ正確で効率的な方法です。 スキャンしたドキュメント、デジタル画像、PDFドキュメントを使用しているかにかかわらず、IronOCRはプロセスを簡素化し、高精度、多言語対応、強力な画像処理ツールを提供します。 このツールは、ドキュメント管理ワークフローの合理化、データ抽出の自動化、またはアクセシビリティの向上を目指している企業に最適です。 無料トライアルを利用して、IronOCRの強力な機能を実際に試してみてください。 完全に動作するようにするには数分しかかからず、すぐにOCRタスクを処理を開始できます! Kannapat Udonpant 今すぐエンジニアリングチームとチャット ソフトウェアエンジニア ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。 関連する記事 更新日 6月 22, 2025 Power Automate OCR(開発者向けチュートリアル) この光学文字認識技術は、ドキュメントのデジタル化、自動化されたPDFデータの抽出とエントリ、請求書処理、スキャンPDFの検索可能化に応用されます。 詳しく読む 更新日 6月 22, 2025 Easyocr対Tesseract (OCR機能の比較) EasyOCR、Tesseract OCR、Keras-OCR、IronOCRのような人気のOCRツールやライブラリは、現代のアプリケーションにこの機能を統合するためによく利用されています。 詳しく読む 更新日 6月 22, 2025 レシートOCRライブラリ(開発者向けリスト) これらのレシートOCR APIライブラリは、強力なレシート機能をシームレスに.NETアプリケーションに統合し、データ管理ワークフローを革新するために開発者を支援します。 詳しく読む Easyocr対Tesseract (OCR機能の比較)レシートOCRライブラリ(...
更新日 6月 22, 2025 Power Automate OCR(開発者向けチュートリアル) この光学文字認識技術は、ドキュメントのデジタル化、自動化されたPDFデータの抽出とエントリ、請求書処理、スキャンPDFの検索可能化に応用されます。 詳しく読む
更新日 6月 22, 2025 Easyocr対Tesseract (OCR機能の比較) EasyOCR、Tesseract OCR、Keras-OCR、IronOCRのような人気のOCRツールやライブラリは、現代のアプリケーションにこの機能を統合するためによく利用されています。 詳しく読む
更新日 6月 22, 2025 レシートOCRライブラリ(開発者向けリスト) これらのレシートOCR APIライブラリは、強力なレシート機能をシームレスに.NETアプリケーションに統合し、データ管理ワークフローを革新するために開発者を支援します。 詳しく読む