跳至頁尾內容

設定與語言

微調 OCR 引擎以獲得完美結果。透過開箱即用的 125 種以上語言支援,精細控制效能與準確度。

Icon Main related to 設定與語言
OCR 詳細設定

1

一般 OCR 設定

透過對數十項參數的細部控制,精細調整 Tesseract 核心引擎。這為進階使用者提供了深度客製化功能,使其能針對特定文件類型、語言或品質挑戰來優化效能。

學習如何:C# Tesseract OCR 配置變數
IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        ReadBarCodes = false,
        RenderHocr = true,
        TesseractVariables = null,
        WhiteListCharacters = null,
        BlackListCharacters = "`ë|^",
    },
    MultiThreaded = false,
    Language = OcrLanguage.English,
    EnableTesseractConsoleMessages = true, // False as default
};
C#
2

進階閱讀的 OCR 設定

進一步了解 OCR 設定選項,以及進階 OCR 讀取方法所支援的語言。

using IronOcr;

IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        // Whitelist alphanumeric characters and common punctuation
        WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /",
        // Blacklist uncommon characters 
        BlackListCharacters = "`ë|^",
    },

    // Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet   
    Language = OcrLanguage.English
};
C#
3

快速 OCR 設定

請針對 OCR 引擎進行最佳化以達到最高速度。透過調整設定,將效能優先於絕對準確度,您便能快速處理大量文件,尤其在速度是關鍵因素的情況下。

了解如何:為 .NET 加速 Tesseract OCR
C#

Icon Main related to 設定與語言
語言

1

支援 125 種語言的 OCR

在 125 種以上的國際語言中實現高準確度。我們的語言套件包含對非拉丁文字(例如阿拉伯文、中文、希伯來文)以及帶有音標符號的語言的強大支援。只需一行程式碼,即可輕鬆新增或切換語言。

學習如何:運用 Iron OCR 掌握多語言 OCR:英文與日文
using IronOcr;

var ocr = new IronTesseract();

// Set the OCR to use Chinese Simplified
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
    var result = ocr.Read(input);

    // Store the recognized text in a string
    string testResult = result.Text;
}
C#
2

多語言閱讀

能從同一頁面上包含多種語言的文件中精準擷取文字。IronOcr 會自動偵測並在指定語言間切換,無需針對每種語言的內容分別處理。

了解如何:使用 Tesseract 處理多種語言
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract()
{   // Set primary language to English
    Language = OcrLanguage.EnglishBest,
};

// Set secondary language to Russian
ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian);

// Add PDF
using var pdfInput = new OcrPdfInput(@"example.pdf");

// Perform OCR
OcrResult result = ocrTesseract.Read(pdfInput);

// Output extracted text to console
Console.WriteLine(result.Text);
C#
3

自訂語言閱讀

透過提供您自行訓練的語言資料,突破內建語言包的限制。即使面對罕見語言、特殊字型或獨特字元集的文件,也能實現高準確度的翻譯。

了解如何:使用自訂語言檔案
using IronOcr;

var ocrTesseract = new IronTesseract();
ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
準備開始了嗎?
Nuget 下載 5,896,332 | 版本: 2026.5 just released
Still Scrolling Icon

還在往下捲動嗎?

想要快速確認成果嗎? PM > Install-Package IronOcr
執行範例 觀看您的圖片轉為可搜尋文字。

鋼鐵支援團隊

我們每週 5 天,每天 24 小時在線上。
聊天
電子郵件
打電話給我