跳過到頁腳內容

OCR 結果

獲取的不只是文字。我們的 API 提供結構化的資料,包括座標、置信度分數以及完整的文件層級結構 (頁、行、字)。

Icon Main related to OCR 結果
數據輸出

1

文字

IronOCR 會將段落、行、字詞和字元的文字輸出回傳為結構化物件和字串,讓開發人員可以快速存取和處理資料。

using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    // Page text
    string PageText = page.Text;
}
C#
2

OCR 文本位置

獲取每個段落、行、單字和字元的精確 X/Y 座標和邊界方塊尺寸,啟用文字高亮、區域 OCR 和資料驗證。

學習如何:在 .NET C# 中萃取讀取結果
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;

// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
C#
3

OCR 輸出信心

接收擷取文字的信心分數。以程式化方式標示低置信度結果,供人工審查,以建立更可靠的自動化工作流程。

學習如何:在 .NET C# 中獲得閱讀信心
using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Load image from file
ocrInput.LoadImage("sameple.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Confidence}%");
C#
4

OCR 元件的影像

除了文字之外,還可將從輸入文件的 OCR 檢測到的文字視覺元素匯出為獨立的影像檔案,對於歸檔或處理非文字資料非常有用。

學習如何:在 .NET C# 中萃取讀取結果
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    foreach (var word in page.Words)
    {
        word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
    }
}
C#

Icon Main related to OCR 結果
輸出類型

1

Text

透過結構化、分層式的 API 存取 OCR 結果。輕鬆地從大段落瀏灠到個別字元,讓您對擷取的文字及其元資料進行粒度控制。

學習如何:在 .NET C# 中萃取讀取結果
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");
C#
2

可搜尋的 PDF

將任何掃描的文件或影像轉換成完全可搜尋的 PDF 檔案。保留原始版面,但所有文字都變成可選擇、可複製和可搜尋。

學習如何:將結果儲存為可搜尋的 PDF
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
C#
3

hOCR

以 hOCR 格式匯出結果,這是一種以 HTML 為基礎的標準,可提供豐富的元資料,包括文字、版面資訊和每個字的座標,非常適合進階文件分析。

學習如何:將結果儲存為 HTML 檔案中的 hOCR
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as HTML
ocrResult.SaveAsHocrFile("result.html");
C#
4

以圖像強調文字

為了進行調試和驗證,請生成原始文件的影像,並將所有已識別的文字突出顯示。這可快速直觀檢查 OCR 引擎的準確性和文字位置。

學習如何:C# 高亮顯示文字以進行除錯
using IronOcr;

IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);
C#
5

BarCode 和 QR Code 值

從文件中找到的任何 BarCode 或 QR code 擷取解碼字串值。API 可在提供文字結果的同時提供此資料,以提供完整的資料擷取解決方案。

學習如何:在 .NET C# 中萃取讀取結果
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;

// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);
C#
準備好開始了嗎?
Nuget 下載 5,167,857 | Version: 2025.11 剛發表