在生產環境中測試,無浮水印。
無論您在哪裡需要,它都能運作。
立即獲取 30 天完整功能版產品。
幾分鐘內即可完成安裝並開始使用。
在產品試用期間,您可隨時聯繫我們的技術支援團隊
不僅是文字。我們的 API 提供結構化資料,包含座標、信心分數,以及完整的文件層級結構(頁面、行、單字)。
using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
// Page text
string PageText = page.Text;
}
精確取得每個段落、行、單字及字元的 X/Y 座標與邊界框尺寸,以實現文字標示、區域 OCR 及資料驗證功能。
學習如何:在 .NET C# 中擷取讀取結果using IronOcr;
using IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;
// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
針對擷取的文字獲得信心分數。透過程式化方式標記信心分數較低的結果,供人工審查,以建立更可靠的自動化工作流程。
學習如何:在 .NET C# 中建立編碼信心using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Load image from file
ocrInput.LoadImage("sameple.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Co/nfidence}%");
除了文字外,還需將從輸入文件中透過 OCR 識別出的視覺元素,以獨立的圖像檔案形式匯出,這對於歸檔或處理非文字資料非常有用。
學習如何:在 .NET C# 中擷取讀取結果using IronOcr;
using IronSoftware.Drawing;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
foreach (var word in page.Words)
{
word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
}
}
透過結構化、分層式的 API 存取 OCR 結果。可輕鬆從大段落瀏覽至單一字元,讓您能精細控制擷取的文字及其元資料。
學習如何:在 .NET C# 中擷取讀取結果using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");
將任何掃描的文件或圖像轉換為可完全搜尋的 PDF 檔案。原始版面配置將被保留,但所有文字皆可被選取、複製及搜尋。
了解如何:將結果儲存為可搜尋的 PDFusing IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable render as searchable PDF
ocrTesseract.Co/nfiguration.RenderSearchablePdf = true;
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
輸出結果採用 hOCR 格式,這是一種基於 HTML 的標準,提供豐富的元資料,包括文字、版面配置資訊以及每個單字的座標,非常適合用於進階文件分析。
了解如何:將結果儲存為 HTML 檔案中的 hOCRusing IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable render as hOCR
ocrTesseract.Co/nfiguration.RenderHocr = true;
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Export as HTML
ocrResult.SaveAsHocrFile("result.html");
為進行除錯與驗證,請生成原始文件的影像檔,並將所有已識別的文字標示出來。這有助於快速透過視覺檢查 OCR 引擎的準確性及文字位置。
學習如何:使用 C# 標示文字以利除錯using IronOcr;
IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);
從文件中找到的任何 BARCODE 或 QR 碼中,提取已解碼的字串值。此 API 會將這些資料與文字結果一併提供,以實現完整的資料擷取解決方案。
學習如何:在 .NET C# 中擷取讀取結果using IronOcr;
using IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable barcodes detection
ocrTesseract.Co/nfiguration.ReadBarCodes = true;
// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);