hOCRをHTMLファイルとして結果を保存する方法 | IronOCR

IronOCR を使用して C# で OCR 結果を hOCR HTML として保存する

This article was translated from English: Does it need improvement?
Translated
View the article in English

hOCR は"HTML ベースの OCR"の略で、光学式文字認識 (OCR) の結果を構造化された方法で表現するために使用されるファイル形式です。 HOCR ファイルは通常、HTML (ハイパーテキスト マークアップ言語) で記述され、認識されたテキスト、レイアウト情報、および画像またはドキュメント内の認識された各文字の座標を保存する方法を提供します。

クイックスタート: OCR出力をhOCR HTMLファイルとして保存

IronOCR を使い始める最も簡単な方法は、hOCR レンダリングを有効にし、1 回の設定と 1 回の呼び出しで結果を HTML ファイルに直接エクスポートすることです。 開発者はすぐに開始して、OCR の結果をすぐに使用可能な HTML マークアップで確認できます。

Nuget Icon今すぐ NuGet で PDF を作成してみましょう:

  1. NuGet パッケージ マネージャーを使用して IronOCR をインストールします

    PM > Install-Package IronOcr

  2. このコード スニペットをコピーして実行します。

    var hocr = new IronTesseract { Configuration = { RenderHocr = true } }.Read(new OcrInput("image.png")).SaveAsHocrString();
  3. 実際の環境でテストするためにデプロイする

    今すぐ無料トライアルでプロジェクトに IronOCR を使い始めましょう
    arrow pointer


結果をhOCRとしてエクスポートする例

結果を hOCR としてエクスポートするには、まずConfiguration.RenderHocrプロパティを true に設定して有効にする必要があります。 Readメソッドから OCR 結果オブジェクトを取得した後、 SaveAsHocrFileメソッドを使用して OCR 結果を HTML としてエクスポートします。 このメソッドは、入力ドキュメントの読み取り結果を含む HTML ファイルを出力します。 以下のコードは、次のサンプル TIFFファイルの使用方法を示しています。

:path=/static-assets/ocr/content-code-examples/how-to/html-export-export-html.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = true;

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
imageInput.Title = "Html Title";

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as HTML
ocrResult.SaveAsHocrFile("result.html");
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = True

' Add image
Dim imageInput = New OcrImageInput("Potter.tiff")
imageInput.Title = "Html Title"

' Perform OCR
Dim ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Export as HTML
ocrResult.SaveAsHocrFile("result.html")
$vbLabelText   $csharpLabel

結果をHTML文字列としてエクスポート

同じ TIFF サンプル イメージを使用して、 SaveAsHocrStringメソッドを利用して OCR 結果を HTML 文字列としてエクスポートできます。 このメソッドは HTML 文字列を返します。

:path=/static-assets/ocr/content-code-examples/how-to/html-export-export-html-string.cs
// Export as HTML string
string hocr = ocrResult.SaveAsHocrString();
' Export as HTML string
Dim hocr As String = ocrResult.SaveAsHocrString()
$vbLabelText   $csharpLabel

よくある質問

hOCRとは何か、それが使用される理由は?

hOCRは「HTMLベースのOCR」を意味し、光学文字認識の結果を構造化された形式で表現するためのファイル形式です。認識されたテキスト、レイアウト情報、および画像やドキュメント内の各文字の座標を、通常はHTML形式で保存するために使用されます。

C#を使用してOCRの結果をhOCRファイルとして保存するにはどうすれば良いですか?

IronOCRを使用してOCR結果をhOCRファイルとして保存するには、まずRenderHocrプロパティをtrueに設定し、その後にSaveAsHocrFileメソッドを使用して結果をHTMLファイルとして出力します。

OCRの結果をHTML文字列としてエクスポートすることは可能ですか?

はい、IronOCRを使用してOCRの結果をHTML文字列としてエクスポートすることができます。RenderHocrプロパティをtrueに設定し、SaveAsHocrStringメソッドを使用することで、OCR結果をHTML文字列形式で取得できます。

IronOCRは画像とPDFの両方に対するOCR処理をサポートしていますか?

IronOCRは画像とPDFドキュメントの両方に対するOCR処理をサポートしており、ユーザーは結果をHTML形式のhOCRとしてエクスポートできます。

C#でOCR結果をhOCRとしてエクスポートする手順は?

C#でOCRの結果をhOCRとしてエクスポートするには、IronOCRライブラリをダウンロードし、画像またはPDFドキュメントを準備し、RenderHocrプロパティをtrueに設定し、SaveAsHocrFileまたはSaveAsHocrStringのいずれかを使用して結果をエクスポートします。

IronOCRを使用するのに適したプログラミング環境は何ですか?

IronOCRは、.NET C#プログラミング環境で使用するのに適しており、C#を扱う開発者に最適です。

OCRの結果をhOCRとして保存するためのサンプルコードはありますか?

はい、IronOCRは、画像ファイルからテキストを読み込み、OCRの結果をhOCRファイルや文字列として保存する実例を、サンプルTIFFファイルを用いた具体的な例を提供しています。

IronOCRでRenderHocrプロパティはどのように使用されますか?

IronOCRのRenderHocrプロパティは、OCR結果をhOCR形式でエクスポートするために使用されます。これをtrueに設定すると、結果をHTMLファイルまたは文字列としてエクスポートできます。

Chaknith Bin
ソフトウェアエンジニア
ChaknithはIronXLとIronBarcodeに取り組んでいます。彼はC#と.NETの深い専門知識を持ち、ソフトウェアの改善や顧客サポートに貢献しています。ユーザーとの対話から得られる洞察が、より良い製品、ドキュメント、および全体的な経験に寄与しています。
レビュー済み
Jeff Fritz
Jeffrey T. Fritz
プリンシパルプログラムマネージャー - .NETコミュニティチーム
Jeffはまた、.NETとVisual Studioチームのプリンシパルプログラムマネージャーです。彼は.NET Conf仮想会議シリーズのエグゼクティブプロデューサーであり、週に二回放送される開発者向けライブストリーム『Fritz and Friends』のホストを務め、テクノロジーについて話すことや視聴者と一緒にコードを書くことをしています。Jeffはワークショップ、プレゼンテーション、およびMicrosoft Build、Microsoft Ignite、.NET Conf、Microsoft MVPサミットを含む最大のMicrosoft開発者イベントのコンテンツを企画しています。
準備はできましたか?
Nuget ダウンロード 5,167,857 | Version: 2025.11 リリース