在生產環境中測試,無浮水印。
無論您在哪裡需要,它都能運作。
立即獲取 30 天完整功能版產品。
幾分鐘內即可完成安裝並開始使用。
在產品試用期間,您可隨時聯繫我們的技術支援團隊
微調 OCR 引擎以獲得完美結果。透過開箱即用的 125 種以上語言支援,精細控制效能與準確度。
透過對數十項參數的細部控制,精細調整 Tesseract 核心引擎。這為進階使用者提供了深度客製化功能,使其能針對特定文件類型、語言或品質挑戰來優化效能。
學習如何:C# Tesseract OCR 配置變數IronTesseract ocr = new IronTesseract
{
Configuration = new TesseractConfiguration
{
ReadBarCodes = false,
RenderHocr = true,
TesseractVariables = null,
WhiteListCharacters = null,
BlackListCharacters = "`ë|^",
},
MultiThreaded = false,
Language = OcrLanguage.English,
EnableTesseractConsoleMessages = true, // False as default
};
using IronOcr;
IronTesseract ocr = new IronTesseract
{
Configuration = new TesseractConfiguration
{
// Whitelist alphanumeric characters and common punctuation
WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /",
// Blacklist uncommon characters
BlackListCharacters = "`ë|^",
},
// Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet
Language = OcrLanguage.English
};
請針對 OCR 引擎進行最佳化以達到最高速度。透過調整設定,將效能優先於絕對準確度,您便能快速處理大量文件,尤其在速度是關鍵因素的情況下。
了解如何:為 .NET 加速 Tesseract OCR
在 125 種以上的國際語言中實現高準確度。我們的語言套件包含對非拉丁文字(例如阿拉伯文、中文、希伯來文)以及帶有音標符號的語言的強大支援。只需一行程式碼,即可輕鬆新增或切換語言。
學習如何:運用 Iron OCR 掌握多語言 OCR:英文與日文using IronOcr;
var ocr = new IronTesseract();
// Set the OCR to use Chinese Simplified
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
var result = ocr.Read(input);
// Store the recognized text in a string
string testResult = result.Text;
}
能從同一頁面上包含多種語言的文件中精準擷取文字。IronOcr 會自動偵測並在指定語言間切換,無需針對每種語言的內容分別處理。
了解如何:使用 Tesseract 處理多種語言using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract()
{ // Set primary language to English
Language = OcrLanguage.EnglishBest,
};
// Set secondary language to Russian
ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian);
// Add PDF
using var pdfInput = new OcrPdfInput(@"example.pdf");
// Perform OCR
OcrResult result = ocrTesseract.Read(pdfInput);
// Output extracted text to console
Console.WriteLine(result.Text);
透過提供您自行訓練的語言資料,突破內建語言包的限制。即使面對罕見語言、特殊字型或獨特字元集的文件,也能實現高準確度的翻譯。
了解如何:使用自訂語言檔案using IronOcr;
var ocrTesseract = new IronTesseract();
ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);