Teste em produção sem marcas d'água.
Funciona onde você precisar.
Receba 30 dias de produto totalmente funcional.
Deixe-o pronto para usar em minutos.
Acesso total à nossa equipe de suporte técnico durante o período de teste do produto.
Ajuste o mecanismo de OCR para obter resultados perfeitos. Tenha controle preciso sobre o desempenho e a precisão, com suporte nativo para mais de 125 idiomas.
Ajuste com precisão o mecanismo principal do Tesseract com controle granular sobre dezenas de parâmetros. Isso oferece personalização profunda para usuários avançados que buscam otimizar o desempenho para tipos de documentos, idiomas ou desafios de qualidade específicos.
Aprenda como configurar variáveis de OCR do Tesseract em C#.IronTesseract ocr = new IronTesseract
{
Configuration = new TesseractConfiguration
{
ReadBarCodes = false,
RenderHocr = true,
TesseractVariables = null,
WhiteListCharacters = null,
BlackListCharacters = "`ë|^",
},
MultiThreaded = false,
Language = OcrLanguage.English,
EnableTesseractConsoleMessages = true, // False as default
};
Saiba mais sobre as configurações de OCR e os idiomas disponíveis para os métodos avançados de leitura de OCR.
using IronOcr;
IronTesseract ocr = new IronTesseract
{
Configuration = new TesseractConfiguration
{
// Whitelist alphanumeric characters and common punctuation
WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /",
// Blacklist uncommon characters
BlackListCharacters = "`ë|^",
},
// Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet
Language = OcrLanguage.English
};
Otimize o mecanismo de OCR para obter a máxima velocidade. Ao ajustar as configurações para priorizar o desempenho em detrimento da precisão absoluta, você pode processar rapidamente grandes volumes de documentos onde a velocidade é o fator crítico.
Aprenda como: OCR Tesseract mais rápido for .NET
Obtenha alta precisão em mais de 125 idiomas internacionais. Nossos pacotes incluem suporte robusto para alfabetos não latinos (como árabe, chinês e hebraico) e idiomas com diacríticos. Adicione ou alterne idiomas facilmente com uma única linha de código.
Aprenda a dominar o OCR multilíngue com o Iron OCR: inglês e japonês.using IronOcr;
var ocr = new IronTesseract();
// Set the OCR to use Chinese Simplified
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
var result = ocr.Read(input);
// Store the recognized text in a string
string testResult = result.Text;
}
Extraia com precisão o texto de documentos que contenham vários idiomas na mesma página. O IronOcr detecta e alterna automaticamente entre os idiomas especificados, eliminando a necessidade de processamento separado para cada conteúdo em idioma diferente.
Aprenda como: Usar vários idiomas com o Tesseractusing IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract()
{ // Set primary language to English
Language = OcrLanguage.EnglishBest,
};
// Set secondary language to Russian
ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian);
// Add PDF
using var pdfInput = new OcrPdfInput(@"example.pdf");
// Perform OCR
OcrResult result = ocrTesseract.Read(pdfInput);
// Output extracted text to console
Console.WriteLine(result.Text);
Vá além dos pacotes de idiomas integrados, fornecendo seus próprios dados de idioma treinados. Obtenha alta precisão em documentos com idiomas raros, fontes especializadas ou conjuntos de caracteres exclusivos.
Aprenda como: Usar arquivos de idioma personalizadosusing IronOcr;
var ocrTesseract = new IronTesseract();
ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);