跳至頁尾內容

OCR 結果

不僅是文字。我們的 API 提供結構化資料,包含座標、信心分數,以及完整的文件層級結構(頁面、行、單字)。

Icon Main related to OCR 結果
資料輸出

1

文本

IronOCR 會將段落、行、單字及字元的文字輸出以結構化物件和字串的形式返回,讓開發人員能夠快速存取並處理這些資料。

using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    // Page text
    string PageText = page.Text;
}
C#
2

OCR 文字位置

精確取得每個段落、行、單字及字元的 X/Y 座標與邊界框尺寸,以實現文字標示、區域 OCR 及資料驗證功能。

學習如何:在 .NET C# 中擷取讀取結果
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;

// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
C#
3

OCR 輸出信心度

針對擷取的文字獲得信心分數。透過程式化方式標記信心分數較低的結果,供人工審查,以建立更可靠的自動化工作流程。

學習如何:在 .NET C# 中建立編碼信心
using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Load image from file
ocrInput.LoadImage("sameple.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Co/nfidence}%");
C#
4

OCR 元素的圖片

除了文字外,還需將從輸入文件中透過 OCR 識別出的視覺元素,以獨立的圖像檔案形式匯出,這對於歸檔或處理非文字資料非常有用。

學習如何:在 .NET C# 中擷取讀取結果
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    foreach (var word in page.Words)
    {
        word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
    }
}
C#

Icon Main related to OCR 結果
輸出類型

1

文字

透過結構化、分層式的 API 存取 OCR 結果。可輕鬆從大段落瀏覽至單一字元,讓您能精細控制擷取的文字及其元資料。

學習如何:在 .NET C# 中擷取讀取結果
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");
C#
2

可搜尋的 PDF 檔案

將任何掃描的文件或圖像轉換為可完全搜尋的 PDF 檔案。原始版面配置將被保留,但所有文字皆可被選取、複製及搜尋。

了解如何:將結果儲存為可搜尋的 PDF
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as searchable PDF
ocrTesseract.Co/nfiguration.RenderSearchablePdf = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
C#
3

hOCR

輸出結果採用 hOCR 格式,這是一種基於 HTML 的標準,提供豐富的元資料,包括文字、版面配置資訊以及每個單字的座標,非常適合用於進階文件分析。

了解如何:將結果儲存為 HTML 檔案中的 hOCR
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as hOCR
ocrTesseract.Co/nfiguration.RenderHocr = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as HTML
ocrResult.SaveAsHocrFile("result.html");
C#
4

將文字標示為圖片

為進行除錯與驗證,請生成原始文件的影像檔,並將所有已識別的文字標示出來。這有助於快速透過視覺檢查 OCR 引擎的準確性及文字位置。

學習如何:使用 C# 標示文字以利除錯
using IronOcr;

IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);
C#
5

BarCode 與 QR 碼的數值

從文件中找到的任何 BARCODE 或 QR 碼中,提取已解碼的字串值。此 API 會將這些資料與文字結果一併提供,以實現完整的資料擷取解決方案。

學習如何:在 .NET C# 中擷取讀取結果
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable barcodes detection
ocrTesseract.Co/nfiguration.ReadBarCodes = true;

// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);
C#
準備開始了嗎?
Nuget 下載 5,896,332 | 版本: 2026.5 just released
Still Scrolling Icon

還在往下捲動嗎?

想要快速確認成果嗎? PM > Install-Package IronOcr
執行範例 觀看您的圖片轉為可搜尋文字。

鋼鐵支援團隊

我們每週 5 天,每天 24 小時在線上。
聊天
電子郵件
打電話給我