フッターコンテンツにスキップ

OCR結果

テキストだけではありません。当社のAPIは、座標、信頼度スコア、完全な文書階層(ページ、行、単語)を含む構造化データを提供します。

Icon Main related to OCR結果
データ出力

1

テキスト

IronOCRは段落、行、単語、文字のテキスト出力を構造化オブジェクトと文字列として返すので、開発者はデータに素早くアクセスして操作することができます。

using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    // Page text
    string PageText = page.Text;
}
C#
2

OCR テキストの場所

段落、行、単語、文字ごとに正確なX/Y座標とバウンディングボックスの寸法を取得し、テキストのハイライト、ゾーンOCR、データ検証を可能にします。

以下の方法を学びましょう:.NET C# で読み取り結果を抽出する
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;

// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
C#
3

OCR出力の信頼性

抽出されたテキストの信頼度スコアを受け取ります。より信頼性の高い自動化ワークフローを構築するために、人間によるレビューのために信頼性の低い結果にプログラムでフラグを付けます。

次の方法を学んでください:.NET C#で自信を持って読む
using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Load image from file
ocrInput.LoadImage("sameple.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Confidence}%");
C#
4

OCR要素のイメージ

テキストに加えて、入力文書からOCRによって検出されたテキストの視覚的要素を別の画像ファイルとしてエクスポートします。

以下の方法を学びましょう:.NET C# で読み取り結果を抽出する
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    foreach (var word in page.Words)
    {
        word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
    }
}
C#

Icon Main related to OCR結果
出力タイプ

1

テキスト

構造化された階層型APIを介してOCR結果にアクセスします。大きな段落から個々の文字まで簡単にナビゲートでき、抽出されたテキストとそのメタデータをきめ細かく制御できます。

以下の方法を学びましょう:.NET C# で読み取り結果を抽出する
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");
C#
2

検索可能な PDF

スキャンした文書や画像を、完全に検索可能なPDFファイルに変換します。元のレイアウトはそのままに、すべてのテキストが選択、コピー、検索可能になります。

検索可能な PDF として結果を保存する 以下の方法を学んでください。
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
C#
3

hOCR

翻訳結果は、高度な文書分析に理想的な、テキスト、レイアウト情報、各単語の座標を含む豊富なメタデータを提供するHTMLベースの標準であるhOCR形式でエクスポートします。

結果を HTML ファイルに hOCR として保存する 以下の方法を学んでください。
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as HTML
ocrResult.SaveAsHocrFile("result.html");
C#
4

テキストを画像としてハイライト

デバッグと検証のために、認識されたすべてのテキストがハイライトされた原文の画像を作成します。これにより、OCRエンジンの精度とテキストの位置を視覚的にすばやく確認できます。

デバッグのための C# ハイライトテキスト の方法を学んでください。
using IronOcr;

IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);
C#
5

バーコードとQRコードの値

ドキュメント内のバーコードやQRコードから、デコードされた文字列値を抽出します。APIは、完全なデータキャプチャソリューションのために、テキスト結果と一緒にこのデータを提供します。

以下の方法を学びましょう:.NET C# で読み取り結果を抽出する
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;

// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);
C#
準備はできましたか?
Nuget ダウンロード 5,167,857 | Version: 2025.11 リリース