Zum Fußzeileninhalt springen

Konfigurationen & Sprachen

Feinabstimmung der OCR-Engine für perfekte Ergebnisse. Erhalten Sie eine granulare Kontrolle über Leistung und Genauigkeit, mit sofortiger Unterstützung für über 125 Sprachen.

Icon Main related to Konfigurationen & Sprachen
OCR Detaillierte Konfigurationen

1

Normale OCR-Konfigurationen

Die Feinabstimmung der Tesseract-Kern-Engine mit granularer Kontrolle über Dutzende von Parametern. Dies ermöglicht eine tiefgreifende Anpassung für fortgeschrittene Benutzer, die die Leistung für bestimmte Dokumenttypen, Sprachen oder Qualitätsanforderungen optimieren möchten.

Erfahren Sie, wie man:C# Tesseract OCR Configuration Variables
IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        ReadBarCodes = false,
        RenderHocr = true,
        TesseractVariables = null,
        WhiteListCharacters = null,
        BlackListCharacters = "`ë|^",
    },
    MultiThreaded = false,
    Language = OcrLanguage.English,
    EnableTesseractConsoleMessages = true, // False as default
};
C#
2

OCR-Konfigurationen für fortgeschrittenes Lesen

Erfahren Sie mehr über die OCR-Konfigurationseinstellungen und die verfügbaren Sprachen für erweiterte OCR-Lesemethoden.

using IronOcr;

IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        // Whitelist alphanumeric characters and common punctuation
        WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /",
        // Blacklist uncommon characters 
        BlackListCharacters = "`ë|^",
    },

    // Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet   
    Language = OcrLanguage.English
};
C#
3

Schnelle OCR-Konfiguration

Optimieren Sie die OCR-Engine für maximale Geschwindigkeit. Indem Sie die Einstellungen so anpassen, dass die Leistung Vorrang vor der absoluten Genauigkeit hat, können Sie schnell große Mengen von Dokumenten verarbeiten, bei denen Geschwindigkeit der entscheidende Faktor ist.

Erfahren Sie, wie man:Schnellere Tesseract OCR für .NET
C#

Icon Main related to Konfigurationen & Sprachen
Sprache auswählen

1

125 unterstützte Sprachen OCR

Erzielen Sie eine hohe Genauigkeit in über 125 internationalen Sprachen. Unsere Pakete bieten zuverlässige Unterstützung für nicht-lateinische Schriften (z. B. Arabisch, Chinesisch, Hebräisch) und Sprachen mit diakritischen Zeichen. Einfaches Hinzufügen oder Wechseln von Sprachen mit einer einzigen Codezeile.

Lernen Sie:Master Multi-Language OCR with IronOCR: English & Japanese
using IronOcr;

var ocr = new IronTesseract();

// Set the OCR to use Chinese Simplified
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
    var result = ocr.Read(input);

    // Store the recognized text in a string
    string testResult = result.Text;
}
C#
2

Mehrsprachiges Lesen

Genaue Extraktion von Text aus Dokumenten, die mehrere Sprachen auf derselben Seite enthalten. IronOcr erkennt automatisch die angegebenen Sprachen und schaltet zwischen ihnen um, so dass eine separate Verarbeitung für jeden Sprachinhalt nicht erforderlich ist.

Erfahren Sie, wie man:Mehrere Sprachen mit Tesseract verwendet
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract()
{   // Set primary language to English
    Language = OcrLanguage.EnglishBest,
};

// Set secondary language to Russian
ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian);

// Add PDF
using var pdfInput = new OcrPdfInput(@"example.pdf");

// Perform OCR
OcrResult result = ocrTesseract.Read(pdfInput);

// Output extracted text to console
Console.WriteLine(result.Text);
C#
3

Kundenspezifische Sprachen Lesen

Gehen Sie über die integrierten Sprachpakete hinaus, indem Sie Ihre eigenen trainierten Sprachdaten bereitstellen. Erzielen Sie eine hohe Genauigkeit bei Dokumenten mit seltenen Sprachen, speziellen Schriftarten oder einzigartigen Zeichensätzen.

Erfahren Sie, wie Sie:Benutzerdefinierte Sprachdateien verwenden
using IronOcr;

var ocrTesseract = new IronTesseract();
ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
Bereit anzufangen?
Nuget Downloads 5,167,857 | Version: 2025.11 gerade veröffentlicht