Passer au contenu du pied de page

Configurations & Langues

Affinez le moteur OCR pour des résultats parfaits. Obtenez un contrôle granulaire sur la performance et la précision, avec un support dès la sortie de la boîte pour plus de 125 langues.

Icon Main related to Configurations & Langues
Configurations détaillées de l'OCR

1

Configurations normales de l'OCR

Affiner le moteur de base de Tesseract grâce à un contrôle granulaire sur des dizaines de paramètres. Cela permet une personnalisation poussée pour les utilisateurs avancés qui cherchent à optimiser les performances pour des types de documents, des langues ou des défis de qualité spécifiques.

Apprenez à:C# Tesseract OCR Variables de configuration
IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        ReadBarCodes = false,
        RenderHocr = true,
        TesseractVariables = null,
        WhiteListCharacters = null,
        BlackListCharacters = "`ë|^",
    },
    MultiThreaded = false,
    Language = OcrLanguage.English,
    EnableTesseractConsoleMessages = true, // False as default
};
C#
2

Configurations OCR pour une lecture avancée

En savoir plus sur les paramètres de configuration de l'OCR et les langues disponibles pour les méthodes de lecture OCR avancées.

using IronOcr;

IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        // Whitelist alphanumeric characters and common punctuation
        WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /",
        // Blacklist uncommon characters 
        BlackListCharacters = "`ë|^",
    },

    // Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet   
    Language = OcrLanguage.English
};
C#
3

Configuration OCR Rapide

Optimisez le moteur OCR pour une vitesse maximale. En ajustant les paramètres pour privilégier les performances plutôt que la précision absolue, vous pouvez traiter rapidement d'énormes volumes de documents pour lesquels la vitesse est un facteur critique.

Apprenez à :Faster Tesseract OCR for .NET
C#

Icon Main related to Configurations & Langues
Langues

1

125 langues prises en charge par l'OCR

Obtenez une grande précision dans plus de 125 langues internationales. Nos packs comprennent une prise en charge solide des écritures non latines (arabe, chinois, hébreu, etc.) et des langues comportant des signes diacritiques. Ajoutez ou changez facilement de langue à l'aide d'une seule ligne de code.

Apprenez à :Maîtriser l'OCR multilingue avec IronOCR : anglais et japonais
using IronOcr;

var ocr = new IronTesseract();

// Set the OCR to use Chinese Simplified
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
    var result = ocr.Read(input);

    // Store the recognized text in a string
    string testResult = result.Text;
}
C#
2

Lecture multilingue

Extraire avec précision du texte à partir de documents contenant plusieurs langues sur la même page. IronOcr détecte et bascule automatiquement entre les langues spécifiées, éliminant ainsi la nécessité d'un traitement séparé pour chaque contenu linguistique.

Apprenez à :Utiliser plusieurs langues avec Tesseract
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract()
{   // Set primary language to English
    Language = OcrLanguage.EnglishBest,
};

// Set secondary language to Russian
ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian);

// Add PDF
using var pdfInput = new OcrPdfInput(@"example.pdf");

// Perform OCR
OcrResult result = ocrTesseract.Read(pdfInput);

// Output extracted text to console
Console.WriteLine(result.Text);
C#
3

Lecture de langues personnalisées

Allez au-delà des packs linguistiques intégrés en fournissant vos propres données linguistiques formées. Obtenez une grande précision sur les documents contenant des langues rares, des polices spécialisées ou des jeux de caractères uniques.

Apprenez à :Utiliser des fichiers de langue personnalisés
using IronOcr;

var ocrTesseract = new IronTesseract();
ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir