在生產環境中進行無水印測試。
無論在何處需要,它都能正常運作。
獲得 30 天完整功能產品試用期。
幾分鐘就能安裝運作。
產品試用期間,您可以隨時聯絡我們的支援工程團隊。
獲取的不僅僅是文字。我們的 API 提供結構化數據,包括座標、置信度評分和完整的文件層次結構(頁、行、字)。
using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
// Page text
string PageText = page.Text;
}取得每個段落、行、單字和字元的精確 X/Y 座標和邊界框尺寸,從而實現文字高亮顯示、區域 OCR 和資料驗證。
學習如何在 .NET C# 中提取讀取結果using IronOcr;
using IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;
// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");取得擷取文字的置信度評分。透過程式自動標記置信度較低的結果,以便人工審核,從而建立更可靠的自動化工作流程。
學習如何:增強您在 .NET C# 的閱讀信心using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Load image from file
ocrInput.LoadImage("sameple.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Confidence}%");除了文字之外,還可以將透過 OCR 從輸入文件中檢測到的文字視覺元素匯出為單獨的圖像文件,這對於存檔或處理非文字資料非常有用。
學習如何在 .NET C# 中提取讀取結果using IronOcr;
using IronSoftware.Drawing;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
foreach (var word in page.Words)
{
word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
}
}透過結構化的分層 API 存取 OCR 結果。您可以輕鬆地從大段落導航到單個字符,從而對提取的文本及其元資料進行精細控制。
學習如何在 .NET C# 中提取讀取結果using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");將任何掃描文件或影像轉換為可全文搜尋的 PDF 檔案。原始佈局得以保留,但所有文字均可選擇、複製和尋找。
了解如何將結果儲存為可搜尋的 PDF 文件using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");以 hOCR 格式匯出結果,這是一種基於 HTML 的標準,可提供豐富的元數據,包括文字、佈局資訊和每個單字的座標,非常適合高級文件分析。
了解如何將結果以 hOCR 格式儲存到 HTML 檔案中using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = true;
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Export as HTML
ocrResult.SaveAsHocrFile("result.html");為了進行調試和驗證,請產生原始文件的圖像,並將所有識別出的文字高亮顯示。這樣可以快速直觀地檢查 OCR 引擎的準確性和文字位置。
學習如何: C# 高亮文字以進行調試using IronOcr;
IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);從文件中的任何條碼或二維碼中提取解碼後的字串值。此 API 提供此數據以及文字結果,從而提供完整的資料擷取解決方案。
學習如何在 .NET C# 中提取讀取結果using IronOcr;
using IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;
// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);