Saltar al pie de página

Configuraciones e Idiomas

Ajuste finamente el motor de OCR para obtener resultados perfectos. Obtenga control granular sobre el rendimiento y la precisión, con soporte directo para más de 125 idiomas.

Icon Main related to Configuraciones e Idiomas
Configuraciones detalladas de OCR

1

Configuraciones normales de OCR

Ajuste fino del motor central de Tesseract con control granular sobre docenas de parámetros. Esto ofrece una personalización profunda para usuarios avanzados que buscan optimizar el rendimiento para tipos de documentos, idiomas o desafíos de calidad específicos.

Aprenda a:C# Variables de configuración de Tesseract OCR
IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        ReadBarCodes = false,
        RenderHocr = true,
        TesseractVariables = null,
        WhiteListCharacters = null,
        BlackListCharacters = "`ë|^",
    },
    MultiThreaded = false,
    Language = OcrLanguage.English,
    EnableTesseractConsoleMessages = true, // False as default
};
C#
2

Configuraciones de OCR para lectura avanzada

Más información sobre los ajustes de configuración del OCR y los idiomas disponibles para los métodos de lectura OCR avanzados.

using IronOcr;

IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        // Whitelist alphanumeric characters and common punctuation
        WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /",
        // Blacklist uncommon characters 
        BlackListCharacters = "`ë|^",
    },

    // Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet   
    Language = OcrLanguage.English
};
C#
3

Configuración rápida de OCR

Optimizar el motor de OCR para obtener la máxima velocidad. Al ajustar la configuración para priorizar el rendimiento sobre la precisión absoluta, puedes procesar rápidamente grandes volúmenes de documentos en los que la velocidad es el factor crítico.

Aprenda a:Tesseract OCR más rápido para .NET
C#

Icon Main related to Configuraciones e Idiomas
Idiomas

1

125 idiomas compatibles con OCR

Consigue una gran precisión en más de 125 idiomas internacionales. Nuestros paquetes incluyen una sólida compatibilidad con alfabetos no latinos (por ejemplo, árabe, chino, hebreo) e idiomas con diacríticos. Añada o cambie fácilmente de idioma con una sola línea de código.

Aprenda a:Dominar el OCR multilingüe con Iron OCR: inglés y japonés
using IronOcr;

var ocr = new IronTesseract();

// Set the OCR to use Chinese Simplified
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
    var result = ocr.Read(input);

    // Store the recognized text in a string
    string testResult = result.Text;
}
C#
2

Lectura multilingüe

Extraiga con precisión texto de documentos que contengan varios idiomas en la misma página. IronOcr detecta y cambia automáticamente entre los idiomas especificados, eliminando la necesidad de procesar por separado el contenido de cada idioma.

Aprenda a:Utilizar varios idiomas con Tesseract
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract()
{   // Set primary language to English
    Language = OcrLanguage.EnglishBest,
};

// Set secondary language to Russian
ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian);

// Add PDF
using var pdfInput = new OcrPdfInput(@"example.pdf");

// Perform OCR
OcrResult result = ocrTesseract.Read(pdfInput);

// Output extracted text to console
Console.WriteLine(result.Text);
C#
3

Lectura de lenguajes personalizados

Vaya más allá de los paquetes de idiomas incorporados proporcionando sus propios datos de idiomas entrenados. Consigue una gran precisión en documentos con idiomas poco comunes, fuentes especializadas o conjuntos de caracteres únicos.

Aprenda a:Utilizar archivos de idioma personalizados
using IronOcr;

var ocrTesseract = new IronTesseract();
ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
¿Listo para empezar?
Nuget Descargas 5,167,857 | Version: 2025.11 recién lanzado