Leer tabla en documento

Este ejemplo de código muestra cómo usar el motor OCR IronTesseract para extraer texto y datos de tabla de un documento PDF.

  1. Se crea una instancia del motor OCR IronTesseract.
  2. Se inicializa un objeto OcrInput, y se carga un archivo PDF (table.pdf) utilizando el método LoadPdf.
  3. El motor OCR procesa el documento usando el método ReadDocumentAdvanced, que devuelve un objeto OcrResult más detallado.
  4. La primera tabla encontrada en el documento se accede usando result.Tables.First(), y se extrae la información de las celdas para esa tabla con CellInfos.
  5. La lista de datos de celdas (cellList) ahora contiene las celdas de la tabla, incluyendo el contenido de texto y otros detalles (por ejemplo, posición de la celda, tamaño).
  6. Este método es útil para extraer datos estructurados como tablas de los PDFs, permitiendo que el texto dentro de cada celda de la tabla sea accedido y procesado programáticamente.

Descubra cómo leer tablas en archivos PDF con IronOCR.

¿Listo para empezar?
Nuget Descargas 5,896,332 | Versión: 2026.5 just released
Still Scrolling Icon

¿Aún desplazándote?

¿Quieres una prueba rápida? PM > Install-Package IronOcr
ejecuta una muestra y observa cómo tu imagen se convierte en texto buscable.