IronOCR ハウツー データ出力 IronOCRを使ってC#で読み取り結果を抽出する方法 カーティス・チャウ 更新日:2026年1月10日 IronOCR をダウンロード NuGet ダウンロード DLL ダウンロード Windows 版 無料トライアル LLM向けのコピー LLM向けのコピー LLM 用の Markdown としてページをコピーする ChatGPTで開く このページについてChatGPTに質問する ジェミニで開く このページについてGeminiに問い合わせる Grokで開く このページについてGrokに質問する 困惑の中で開く このページについてPerplexityに問い合わせる 共有する Facebook で共有 Xでシェア(Twitter) LinkedIn で共有 URLをコピー 記事をメールで送る This article was translated from English: Does it need improvement? Translated View the article in English IronOCRのReadメソッドは、抽出されたテキストと、検出された各要素の正確な座標、寸法、テキストの方向、階層構造(段落、行、単語、文字)を含む詳細なメタデータを含むOcrResultオブジェクトを返します。 OCRの結果には、検出された段落、行、単語、個々の文字に関する包括的な情報が含まれています。 各要素について、テキストの内容、正確なX座標とY座標、寸法(幅と高さ)、テキストの方向(左から右または上から下)、CropRectangleオブジェクト内の位置を提供します。 クイックスタート: 最初に検出された単語から単語テキストを取得する IronTesseractのReadメソッドを使用して画像をOCRし、Wordsコレクションを使用して最初の単語のテキストを抽出します。 今すぐ NuGet で PDF を作成してみましょう: NuGet パッケージ マネージャーを使用して IronOCR をインストールします PM > Install-Package IronOcr このコード スニペットをコピーして実行します。 string wordText = new IronTesseract().Read("file.jpg").Words[0].Text; 実際の環境でテストするためにデプロイする 今すぐ無料トライアルでプロジェクトに IronOCR を使い始めましょう 30日間無料トライアル ### 最小限のワークフロー(5ステップ) 読み取り結果にアクセスするためのC#ライブラリをダウンロードする ターゲット画像と PDF ドキュメントを準備する インポートした文書に対してOCRを実行するには、 Readメソッドを使用します。 結果の X, Y、幅、高さ、およびテキスト方向にアクセスする 検出された段落、行、単語、および文字の比較をチェックする OCR結果からどのようなデータを抽出できますか? 翻訳結果には抽出されたテキストだけでなく、IronOCRによってPDFや画像ドキュメントから発見されたページ、段落、行、単語、文字、バーコードの情報も含まれます。 OcrResultオブジェクトから、Readメソッドを使用して、この情報にアクセスできます。 IronOCRの包括的な結果システムは、強力なTesseract 5エンジンをベースに構築されており、単純なテキスト認識以上の構造化データ抽出機能を開発者に提供します。 スキャンされたドキュメント、写真、スクリーンショットのいずれを処理する場合でも、OcrResultクラスは抽出されたデータを細かく制御します。 :path=/static-assets/ocr/content-code-examples/how-to/read-results-output-information.cs using IronOcr; using System; using static IronOcr.OcrResult; // Instantiate IronTesseract IronTesseract ocrTesseract = new IronTesseract(); // Add image using var imageInput = new OcrImageInput("sample.jpg"); // Perform OCR OcrResult ocrResult = ocrTesseract.Read(imageInput); // Retrieve list of detected paragraphs Paragraph[] paragraphs = ocrResult.Paragraphs; // Output information to console Console.WriteLine($"Text: {paragraphs[0].Text}"); Console.WriteLine($"X: {paragraphs[0].X}"); Console.WriteLine($"Y: {paragraphs[0].Y}"); Console.WriteLine($"Width: {paragraphs[0].Width}"); Console.WriteLine($"Height: {paragraphs[0].Height}"); Console.WriteLine($"Text direction: {paragraphs[0].TextDirection}"); Imports IronOcr Imports System Imports IronOcr.OcrResult ' Instantiate IronTesseract Private ocrTesseract As New IronTesseract() ' Add image Private imageInput = New OcrImageInput("sample.jpg") ' Perform OCR Private ocrResult As OcrResult = ocrTesseract.Read(imageInput) ' Retrieve list of detected paragraphs Private paragraphs() As Paragraph = ocrResult.Paragraphs ' Output information to console Console.WriteLine($"Text: {paragraphs(0).Text}") Console.WriteLine($"X: {paragraphs(0).X}") Console.WriteLine($"Y: {paragraphs(0).Y}") Console.WriteLine($"Width: {paragraphs(0).Width}") Console.WriteLine($"Height: {paragraphs(0).Height}") Console.WriteLine($"Text direction: {paragraphs(0).TextDirection}") $vbLabelText $csharpLabel OCR結果からテキスト コンテンツにアクセスするには? OcrResultオブジェクトは、抽出されたテキストをシンプルで直感的な方法で表示するため、開発者はそれを直接使用したり、他のアプリケーションコンポーネントに統合したりすることができます。 階層構造は、自然なドキュメントのテキスト構成を反映しており、異なる粒度レベルのコンテンツを簡単に扱うことができます。 多言語サポートを必要とするアプリケーションのために、IronOCRは多言語ドキュメントをシームレスに処理し、すべての125のサポート言語で同じ構造化された結果フォーマットを維持します。 次のコード例は、結果を確認するためにループでテキストを表示します。 :path=/static-assets/ocr/content-code-examples/how-to/read-results-output-text.cs using IronOcr; using System; using static IronOcr.OcrResult; // Instantiate IronTesseract IronTesseract ocrTesseract = new IronTesseract(); // Add image using var imageInput = new OcrImageInput("sampleText.png"); // Perform OCR OcrResult ocrResult = ocrTesseract.Read(imageInput); // Retrieve list of detected paragraphs Paragraph[] paragraphs = ocrResult.Paragraphs; // Loop through each paragraph in the array Console.WriteLine("--- All Detected Paragraphs ---"); foreach (Paragraph paragraph in paragraphs) { // Print the text of the current paragraph Console.WriteLine(paragraph.Text); // Add a blank line for better separation (optional) Console.WriteLine(); } Imports IronOcr Imports System Imports IronOcr.OcrResult ' Instantiate IronTesseract Dim ocrTesseract As New IronTesseract() ' Add image Using imageInput As New OcrImageInput("sampleText.png") ' Perform OCR Dim ocrResult As OcrResult = ocrTesseract.Read(imageInput) ' Retrieve list of detected paragraphs Dim paragraphs As Paragraph() = ocrResult.Paragraphs ' Loop through each paragraph in the array Console.WriteLine("--- All Detected Paragraphs ---") For Each paragraph As Paragraph In paragraphs ' Print the text of the current paragraph Console.WriteLine(paragraph.Text) ' Add a blank line for better separation (optional) Console.WriteLine() Next End Using $vbLabelText $csharpLabel 出力 . コンソール出力はIronOCRが段落テキストを一行ずつ正確に抽出していることを示しています。 このエンジンは段落境界を自動的に検出するため、複数のテキストブロックがある複雑な文書の処理に最適です。 検出されたテキストの位置座標を取得するにはどうすればよいですか? 抽出されたテキストに加えて、OcrResultは詳細な位置データを提供します。 この空間情報は、レイアウトの忠実度を維持したり、特定のドキュメント領域から的を絞ったテキスト抽出を行う必要があるアプリケーションにとって非常に重要です。 座標系は、ページの左上隅からの標準ピクセル寸法を使用します。 座標ベースの操作の精度を高めるには、OCR リージョン ターゲティングを使用して特定の領域に焦点を当てたり、Computer Vision 機能を活用してテキスト領域を自動的に識別したりすることを検討してください。 次のコードは、各段落を繰り返し処理し、その座標(XとY)をコンソールに表示することを示します。 :path=/static-assets/ocr/content-code-examples/how-to/read-results-output-text.cs using IronOcr; using System; using static IronOcr.OcrResult; // Instantiate IronTesseract IronTesseract ocrTesseract = new IronTesseract(); // Add image using var imageInput = new OcrImageInput("sampleText.png"); // Perform OCR OcrResult ocrResult = ocrTesseract.Read(imageInput); // Retrieve list of detected paragraphs Paragraph[] paragraphs = ocrResult.Paragraphs; // Loop through each paragraph in the array Console.WriteLine("--- All Detected Paragraphs ---"); foreach (Paragraph paragraph in paragraphs) { // Print the text of the current paragraph Console.WriteLine(paragraph.Text); // Add a blank line for better separation (optional) Console.WriteLine(); } Imports IronOcr Imports System Imports IronOcr.OcrResult ' Instantiate IronTesseract Dim ocrTesseract As New IronTesseract() ' Add image Using imageInput As New OcrImageInput("sampleText.png") ' Perform OCR Dim ocrResult As OcrResult = ocrTesseract.Read(imageInput) ' Retrieve list of detected paragraphs Dim paragraphs As Paragraph() = ocrResult.Paragraphs ' Loop through each paragraph in the array Console.WriteLine("--- All Detected Paragraphs ---") For Each paragraph As Paragraph In paragraphs ' Print the text of the current paragraph Console.WriteLine(paragraph.Text) ' Add a blank line for better separation (optional) Console.WriteLine() Next End Using $vbLabelText $csharpLabel 出力 . 出力は、3つの段落に対応する3組の座標を示しています。これらの座標は、バウンディングボックスの描画、特定領域の抽出、テキスト要素間の空間的関係の維持に使用できます。 OCRの結果には他にどのような属性がありますか? IronOCRはテキストとテキスト座標に加えて、追加情報を提供します。 各テキスト要素(段落、行、単語、個々の文字)について、以下の情報があります: テキスト: 文字列としての実際のテキスト。 X:ページの左端からのピクセル単位での位置。 Y:ページの上端からのピクセル単位での位置。 幅: ピクセル単位の幅です。 高さ: ピクセル単位の高さ。 テキストの方向:テキストが読まれた方向(左から右、または上から下)。 位置:このテキストがページ上のどこにあるかをピクセル単位で示す四角形。 これらの属性は、実装時に特に役立ちます: テキストハイライトと注釈システム フォームフィールドの自動検出 文書変換におけるレイアウト保持 データ抽出のための空間テキスト分析 デバッグと視覚化のために、ハイライトテキスト機能を使用して、検出された領域の精度を視覚的に確認してください。 段落、行、単語、文字はどのように比較されますか? IronOCRの階層的なテキスト構造により、開発者は特定のユースケースに適した詳細レベルで作業することができます。 これらの要素の違いを理解することは、アプリケーションに適した粒度を選択するのに役立ちます。 以下は、検出された段落、行、単語、文字の比較です。 段落 ライン Word キャラクター それぞれの粒度レベルには異なる目的があります: 段落: 文書構造分析とテキスト一括抽出に最適です。 行:読み順を維持し、表形式のデータを処理するのに便利です。 単語: 検索機能とテキスト分析に最適です。 文字:スペルチェックや精密なテキスト編集アプリケーションに最適です。 IronOCRはバーコードやQRコードを読み取れますか? はい、IronOCRはバーコードとQRコードを読むことができます。 この機能はIronBarcodeほど堅牢ではないかもしれませんが、IronOCRは一般的なバーコードタイプをサポートしています。バーコード検出を有効にするには、Configuration.ReadBarCodesプロパティをtrueに設定する。 この統合された機能により、IronOCRはインボイス、出荷ラベル、製品カタログのようなテキストとBarCodeの両方を含む文書の処理に最適です。 さらに、検出された BarCode から、フォーマット、値、座標 (x, y)、高さ、幅、IronSoftware.Drawing.Rectangle オブジェクトとしての位置などの貴重な情報を抽出することができます。 IronDrawingのこのRectangleクラスを使用すると、ドキュメント上で正確な配置が可能になります。 より高度な BarCode 読み取りシナリオについては、ドキュメントの包括的なバーコード読み取り例をご覧ください。 :path=/static-assets/ocr/content-code-examples/how-to/read-results-barcodes.cs using IronOcr; using System; using static IronOcr.OcrResult; // Instantiate IronTesseract IronTesseract ocrTesseract = new IronTesseract(); // Enable barcodes detection ocrTesseract.Configuration.ReadBarCodes = true; // Add image using OcrInput ocrInput = new OcrInput(); ocrInput.LoadPdf("sample.pdf"); // Perform OCR OcrResult ocrResult = ocrTesseract.Read(ocrInput); // Output information to console foreach(var barcode in ocrResult.Barcodes) { Console.WriteLine("Format = " + barcode.Format); Console.WriteLine("Value = " + barcode.Value); Console.WriteLine("X = " + barcode.X); Console.WriteLine("Y = " + barcode.Y); } Console.WriteLine(ocrResult.Text); Imports IronOcr Imports System Imports IronOcr.OcrResult ' Instantiate IronTesseract Private ocrTesseract As New IronTesseract() ' Enable barcodes detection ocrTesseract.Configuration.ReadBarCodes = True ' Add image Using ocrInput As New OcrInput() ocrInput.LoadPdf("sample.pdf") ' Perform OCR Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput) ' Output information to console For Each barcode In ocrResult.Barcodes Console.WriteLine("Format = " & barcode.Format) Console.WriteLine("Value = " & barcode.Value) Console.WriteLine("X = " & barcode.X) Console.WriteLine("Y = " & barcode.Y) Next barcode Console.WriteLine(ocrResult.Text) End Using $vbLabelText $csharpLabel バーコード検出の出力はどのように見えますか? IronOCRのバーコード検出機能は、テキスト抽出とシームレスに統合され、テキストコンテンツとバーコードデータの両方を含む統一された結果を提供します。 この2つの機能は、両方の情報タイプの抽出と相関が必要な自動文書処理ワークフローにとって価値があります。 出力は、IronOCRが複数のバーコードタイプを同時に検出し、フォーマット識別(QRCodeやEAN8など)、デコードされた値、検出された各コードの正確な座標情報を提供する能力を示しています。 この包括的なデータにより、開発者は、さまざまな種類のコンテンツを効率的に処理する高度な文書処理アプリケーションを構築することができます。 よくある質問 OcrResultオブジェクトにはどのような情報が含まれていますか? IronOCRのOcrResultオブジェクトには、抽出されたテキストに加えて、正確なX/Y座標、寸法(幅と高さ)、テキストの方向(左から右または上から下)、検出された各要素の段落、行、単語、個々の文字として整理された階層構造などの詳細なメタデータが含まれています。 OCR結果から最初の単語をすばやく抽出する方法を教えてください。 IronOCRのReadメソッドを使い、Wordsコレクションにアクセスすることで最初の単語のテキストを抽出することができます: `string wordText = new IronTesseract().Read("file.jpg").Words[0].Text;`.これにより、OCR結果から個々の単語要素に即座にアクセスできるようになります。 OCRの結果にはどのような座標データがありますか? IronOCRは検出された各要素(段落、行、単語、文字)の正確なX、Y座標と幅、高さ寸法を提供します。この座標データはCropRectangleオブジェクトを通してアクセスでき、テキスト要素の正確な位置追跡を可能にします。 テキストコンテンツ以外のメタデータを抽出できますか。 IronOCRは、PDFやイメージ・ドキュメントから発見されたページ、段落、行、単語、文字、バーコードまでも含む包括的なメタデータを抽出します。OcrResultオブジェクトは、各要素のテキスト方向、階層構造、空間情報へのアクセスを提供します。 OCR結果を得るために処理できる文書の種類は? IronOCRはスキャン文書、写真、スクリーンショット、PDF、画像ファイルなど様々な種類の文書を処理することができます。Readメソッドはこれらのフォーマットで一貫して動作し、完全なメタデータを持つ同じ構造のOcrResultオブジェクトを返します。 抽出されたテキストはどのように整理されますか? IronOCRは抽出されたテキストを自然な文書構成を反映した階層構造で整理します。OcrResultオブジェクトは、ページ全体から個々の文字まで、さまざまな粒度レベルでコンテンツを表示するため、アプリケーションに適したレベルでテキストを簡単に扱うことができます。 カーティス・チャウ 今すぐエンジニアリングチームとチャット テクニカルライター Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。 準備はできましたか? Nuget ダウンロード 5,384,824 | バージョン: 2026.2 リリース NuGet 無料版 総ダウンロード数: 5,384,824 ライセンスを見る