Teste em produção sem marcas d'água.
Funciona onde você precisar.
Receba 30 dias de produto totalmente funcional.
Deixe-o pronto para usar em minutos.
Acesso total à nossa equipe de suporte técnico durante o período de teste do produto.
Obtenha mais do que apenas texto. Nossa API fornece dados estruturados, incluindo coordenadas, níveis de confiança e uma hierarquia completa do documento (páginas, linhas, palavras).
O IronOCR retorna o texto resultante de parágrafos, linhas, palavras e caracteres como objetos estruturados e strings, permitindo que os desenvolvedores acessem e manipulem os dados rapidamente.
using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
// Page text
string PageText = page.Text;
}
Obtenha as coordenadas X/Y precisas e as dimensões da caixa delimitadora para cada parágrafo, linha, palavra e caractere, permitindo o realce de texto, OCR zonal e validação de dados.
Aprenda como: Extrair resultados de leitura em .NET C#using IronOcr;
using IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;
// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
Receba uma pontuação de confiança para os textos extraídos. Sinalize programaticamente os resultados de baixa confiança para revisão humana, a fim de criar fluxos de trabalho de automação mais confiáveis.
Aprenda como: Obter confiança na leitura em .NET C#using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Load image from file
ocrInput.LoadImage("sameple.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Confidence}%");
Além do texto, exporte os elementos visuais dos textos detectados por OCR do documento de entrada como arquivos de imagem separados, úteis para arquivar ou processar dados não textuais.
Aprenda como: Extrair resultados de leitura em .NET C#using IronOcr;
using IronSoftware.Drawing;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
foreach (var word in page.Words)
{
word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
}
}
Acesse os resultados do OCR por meio de uma API estruturada e hierárquica. Navegue facilmente de grandes parágrafos até caracteres individuais, obtendo controle preciso sobre o texto extraído e seus metadados.
Aprenda como: Extrair resultados de leitura em .NET C#using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");
Converta qualquer documento ou imagem digitalizada em um arquivo PDF totalmente pesquisável. O layout original é preservado, mas todo o texto se torna selecionável, copiável e localizável.
Aprenda como: Salvar resultados como um PDF pesquisávelusing IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
Exporte os resultados no formato hOCR, um padrão baseado em HTML que fornece metadados abrangentes, incluindo texto, informações de layout e coordenadas para cada palavra, ideal para análises avançadas de documentos.
Aprenda como: Salvar resultados como hOCR em um arquivo HTMLusing IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = true;
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Export as HTML
ocrResult.SaveAsHocrFile("result.html");
Para depuração e verificação, gere uma imagem do documento original com todo o texto reconhecido destacado. Isso permite uma verificação visual rápida da precisão do mecanismo de OCR e da localização do texto.
Aprenda como: Realçar textos em C# para depuraçãousing IronOcr;
IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);
Extrai os valores de string decodificados de quaisquer códigos de barras ou códigos QR encontrados no documento. A API fornece esses dados juntamente com os resultados de texto, oferecendo uma solução completa de captura de dados.
Aprenda como: Extrair resultados de leitura em .NET C#using IronOcr;
using IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;
// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);