在生產環境中無水印測試。
無論您需要它在哪裡運作都可以。
取得30天的完全功能產品。
幾分鐘內即可上手並運行。
在您的產品試用期間,獲得完整的工程師支援
微調 OCR 引擎以獲得完美結果。對性能和精度進行細微控制,並支援超過 125 種語言的開箱即用支援。
微調核心 Tesseract 引擎,細緻控制數十個參數。這可為希望針對特定文件類型、語言或品質挑戰優化效能的進階使用者提供深度自訂功能。
學習如何:C# Tesseract OCR 配置變數IronTesseract ocr = new IronTesseract
{
Configuration = new TesseractConfiguration
{
ReadBarCodes = false,
RenderHocr = true,
TesseractVariables = null,
WhiteListCharacters = null,
BlackListCharacters = "`ë|^",
},
MultiThreaded = false,
Language = OcrLanguage.English,
EnableTesseractConsoleMessages = true, // False as default
};
using IronOcr;
IronTesseract ocr = new IronTesseract
{
Configuration = new TesseractConfiguration
{
// Whitelist alphanumeric characters and common punctuation
WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /",
// Blacklist uncommon characters
BlackListCharacters = "`ë|^",
},
// Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet
Language = OcrLanguage.English
};
優化 OCR 引擎以達到最高速度。透過調整設定,讓效能優先於絕對精確度,您就可以快速處理大量文件,而速度就是關鍵因素。
學習如何:為 .NET 提供更快的 Tesseract OCR
達到 125 種以上國際語言的高準確性。我們的套件包括對非拉丁文字 (例如阿拉伯文、中文、希伯來文) 和帶有變音符號的語言的強大支援。只需一行程式碼即可輕鬆新增或切換語言。
學習如何:使用 IronOCR 掌握多國語言 OCR:英文和日文using IronOcr;
var ocr = new IronTesseract();
// Set the OCR to use Chinese Simplified
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
var result = ocr.Read(input);
// Store the recognized text in a string
string testResult = result.Text;
}
準確地從同一頁面上包含多種語言的文件中抽取文字。IronOcr 可自動偵測並在指定語言之間切換,無需對每種語言內容進行單獨處理。
學習如何:使用 Tesseract 的多國語言using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract()
{ // Set primary language to English
Language = OcrLanguage.EnglishBest,
};
// Set secondary language to Russian
ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian);
// Add PDF
using var pdfInput = new OcrPdfInput(@"example.pdf");
// Perform OCR
OcrResult result = ocrTesseract.Read(pdfInput);
// Output extracted text to console
Console.WriteLine(result.Text);
透過提供您自己訓練的語言資料,超越內建的語言套件。在使用罕見語言、專用字型或獨特字元集的文件上達到高準確度。
學習如何:使用自訂語言檔案using IronOcr;
var ocrTesseract = new IronTesseract();
ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);