跳過到頁腳內容

設定與語言

微調 OCR 引擎以獲得完美結果。對性能和精度進行細微控制,並支持超過 125 種語言的開箱即用支持。

Icon Main related to 設定與語言
OCR 詳細配置

1

一般 OCR 配置

微調核心 Tesseract 引擎,細緻控制數十個參數。這可為希望針對特定文件類型、語言或品質挑戰優化效能的進階使用者提供深度自訂功能。

學習如何:C# Tesseract OCR 配置變數
IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        ReadBarCodes = false,
        RenderHocr = true,
        TesseractVariables = null,
        WhiteListCharacters = null,
        BlackListCharacters = "`ë|^",
    },
    MultiThreaded = false,
    Language = OcrLanguage.English,
    EnableTesseractConsoleMessages = true, // False as default
};
C#
2

進階閱讀的 OCR 配置

進一步瞭解 OCR 配置設定以及進階 OCR 閱讀方法的可用語言。

using IronOcr;

IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        // Whitelist alphanumeric characters and common punctuation
        WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /",
        // Blacklist uncommon characters 
        BlackListCharacters = "`ë|^",
    },

    // Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet   
    Language = OcrLanguage.English
};
C#
3

快速OCR配置

優化 OCR 引擎以達到最高速度。透過調整設定,讓效能優先於絕對精確度,您就可以快速處理大量文件,而速度就是關鍵因素。

學習如何:為 .NET 提供更快的 Tesseract OCR
C#

Icon Main related to 設定與語言
語言

1

支援 125 種語言 OCR

達到 125 種以上國際語言的高準確性。我們的套件包括對非拉丁文字 (例如阿拉伯文、中文、希伯來文) 和帶有變音符號的語言的強大支援。只需一行程式碼即可輕鬆新增或切換語言。

學習如何:使用 IronOCR 掌握多國語言 OCR:英文和日文
using IronOcr;

var ocr = new IronTesseract();

// Set the OCR to use Chinese Simplified
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
    var result = ocr.Read(input);

    // Store the recognized text in a string
    string testResult = result.Text;
}
C#
2

多語言閱讀

準確地從同一頁面上包含多種語言的文件中抽取文字。IronOcr 可自動偵測並在指定語言之間切換,無需對每種語言內容進行單獨處理。

學習如何:使用 Tesseract 的多國語言
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract()
{   // Set primary language to English
    Language = OcrLanguage.EnglishBest,
};

// Set secondary language to Russian
ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian);

// Add PDF
using var pdfInput = new OcrPdfInput(@"example.pdf");

// Perform OCR
OcrResult result = ocrTesseract.Read(pdfInput);

// Output extracted text to console
Console.WriteLine(result.Text);
C#
3

自訂語言閱讀

透過提供您自己訓練的語言資料,超越內建的語言套件。在使用罕見語言、專用字型或獨特字元集的文件上達到高準確度。

學習如何:使用自訂語言檔案
using IronOcr;

var ocrTesseract = new IronTesseract();
ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
準備好開始了嗎?
Nuget 下載 5,167,857 | Version: 2025.11 剛發表