Ir para o conteúdo do rodapé

Configurações e idiomas

Ajuste o mecanismo de OCR para obter resultados perfeitos. Tenha controle preciso sobre o desempenho e a precisão, com suporte nativo para mais de 125 idiomas.

Icon Main related to Configurações e idiomas
Configurações detalhadas de OCR

1

Configurações normais de OCR

Ajuste com precisão o mecanismo principal do Tesseract com controle granular sobre dezenas de parâmetros. Isso oferece personalização profunda para usuários avançados que buscam otimizar o desempenho para tipos de documentos, idiomas ou desafios de qualidade específicos.

Aprenda como configurar variáveis de OCR do Tesseract em C#.
IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        ReadBarCodes = false,
        RenderHocr = true,
        TesseractVariables = null,
        WhiteListCharacters = null,
        BlackListCharacters = "`ë|^",
    },
    MultiThreaded = false,
    Language = OcrLanguage.English,
    EnableTesseractConsoleMessages = true, // False as default
};
C#
2

Configurações de OCR para leitura avançada

Saiba mais sobre as configurações de OCR e os idiomas disponíveis para os métodos avançados de leitura de OCR.

using IronOcr;

IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        // Whitelist alphanumeric characters and common punctuation
        WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /",
        // Blacklist uncommon characters 
        BlackListCharacters = "`ë|^",
    },

    // Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet   
    Language = OcrLanguage.English
};
C#
3

Configuração rápida de OCR

Otimize o mecanismo de OCR para obter a máxima velocidade. Ao ajustar as configurações para priorizar o desempenho em detrimento da precisão absoluta, você pode processar rapidamente grandes volumes de documentos onde a velocidade é o fator crítico.

Aprenda como: OCR Tesseract mais rápido for .NET
C#

Icon Main related to Configurações e idiomas
Línguas

1

Suporte a OCR em 125 idiomas

Obtenha alta precisão em mais de 125 idiomas internacionais. Nossos pacotes incluem suporte robusto para alfabetos não latinos (como árabe, chinês e hebraico) e idiomas com diacríticos. Adicione ou alterne idiomas facilmente com uma única linha de código.

Aprenda a dominar o OCR multilíngue com o Iron OCR: inglês e japonês.
using IronOcr;

var ocr = new IronTesseract();

// Set the OCR to use Chinese Simplified
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
    var result = ocr.Read(input);

    // Store the recognized text in a string
    string testResult = result.Text;
}
C#
2

Leitura Multilíngue

Extraia com precisão o texto de documentos que contenham vários idiomas na mesma página. O IronOcr detecta e alterna automaticamente entre os idiomas especificados, eliminando a necessidade de processamento separado para cada conteúdo em idioma diferente.

Aprenda como: Usar vários idiomas com o Tesseract
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract()
{   // Set primary language to English
    Language = OcrLanguage.EnglishBest,
};

// Set secondary language to Russian
ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian);

// Add PDF
using var pdfInput = new OcrPdfInput(@"example.pdf");

// Perform OCR
OcrResult result = ocrTesseract.Read(pdfInput);

// Output extracted text to console
Console.WriteLine(result.Text);
C#
3

Leitura de idiomas personalizados

Vá além dos pacotes de idiomas integrados, fornecendo seus próprios dados de idioma treinados. Obtenha alta precisão em documentos com idiomas raros, fontes especializadas ou conjuntos de caracteres exclusivos.

Aprenda como: Usar arquivos de idioma personalizados
using IronOcr;

var ocrTesseract = new IronTesseract();
ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
Pronto para começar?
Nuget Downloads 5,525,971 | Versão: 2026.3 acaba de ser lançado
Still Scrolling Icon

Ainda está rolando a tela?

Quer provas rápidas? PM > Install-Package IronOcr
executar um exemplo Veja sua imagem se transformar em texto pesquisável.

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me