Probar en producción sin marcas de agua.
Funciona donde lo necesites.
Obtén 30 días de producto completamente funcional.
Instálalo y ejecútalo en minutos.
Acceso completo a nuestro equipo de soporte técnico durante tu prueba del producto
Obtenga algo más que texto. Nuestra API proporciona datos estructurados que incluyen coordenadas, puntuaciones de confianza y una jerarquía completa del documento (páginas, líneas, palabras).
IronOCR devuelve la salida de texto para párrafos, líneas, palabras y caracteres como objetos estructurados y cadenas, lo que permite a los desarrolladores acceder a los datos y manipularlos rápidamente.
using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
// Page text
string PageText = page.Text;
}Obtenga las coordenadas X/Y precisas y las dimensiones del cuadro delimitador de cada párrafo, línea, palabra y carácter, lo que permite resaltar texto, realizar OCR por zonas y validar datos.
Aprenda a:Extraer resultados de lectura en .NET C#using IronOcr;
using IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;
// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");Recibe una puntuación de confianza para los textos extraídos. Marque de forma programática los resultados de baja confianza para su revisión humana con el fin de crear flujos de trabajo de automatización más fiables.
Aprenda a:Conseguir confianza de lectura en .NET C#using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Load image from file
ocrInput.LoadImage("sameple.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Confidence}%");Además del texto, exporte los elementos visuales de los textos detectados a partir del OCR del documento de entrada como archivos de imagen independientes, útiles para archivar o procesar datos no textuales.
Aprenda a:Extraer resultados de lectura en .NET C#using IronOcr;
using IronSoftware.Drawing;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
foreach (var word in page.Words)
{
word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
}
}Accede a los resultados del OCR a través de una API estructurada y jerárquica. Navegue fácilmente desde párrafos extensos hasta caracteres individuales, lo que le proporciona un control granular sobre el texto extraído y sus metadatos.
Aprenda a:Extraer resultados de lectura en .NET C#using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");Convierta cualquier documento o imagen escaneada en un archivo PDF que permita realizar búsquedas. Se conserva el diseño original, pero todo el texto se puede seleccionar, copiar y encontrar.
Aprenda a:Guardar los resultados como PDF con función de búsquedausing IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");Exporte los resultados en formato hOCR, un estándar basado en HTML que proporciona metadatos enriquecidos, incluidos texto, información de diseño y coordenadas para cada palabra, ideales para el análisis avanzado de documentos.
Aprenda a:Guardar resultados como hOCR en un archivo HTMLusing IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = true;
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Export as HTML
ocrResult.SaveAsHocrFile("result.html");Para la depuración y la verificación, genera una imagen del documento original con todo el texto reconocido resaltado. Esto proporciona una rápida comprobación visual de la precisión del motor de OCR y de la ubicación del texto.
Aprenda a:Resaltar textos en C# para depurarusing IronOcr;
IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);Extraiga los valores de cadena descodificados de cualquier código de barras o código QR que se encuentre en el documento. La API proporciona estos datos junto con los resultados de texto para una solución completa de captura de datos.
Aprenda a:Extraer resultados de lectura en .NET C#using IronOcr;
using IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;
// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);