Leer tabla en documento

Este ejemplo de código demuestra cómo utilizar el motor de OCR IronTesseract para extraer texto y datos de tablas de un documento PDF.

  1. Se crea una instancia del motor de OCR IronTesseract.
  2. Se inicializa un objeto OcrInput y se carga un archivo PDF ("table.pdf") utilizando el método LoadPdf.
  3. El motor de OCR procesa el documento utilizando el método ReadDocumentAdvanced, que devuelve un objeto OcrResult más detallado.
  4. Se accede a la primera tabla que se encuentra en el documento utilizando result.Tables.First(), y la información de la celda de esa tabla se extrae con CellInfos.
  5. La lista de datos de celdas (cellList) ahora contiene las celdas de la tabla, incluido el contenido de texto y otros detalles (por ejemplo, posición de la celda, tamaño).
  6. Este método es útil para extraer datos estructurados como tablas de los PDFs, permitiendo que el texto dentro de cada celda de la tabla sea accedido y procesado programáticamente.

Descubra cómo leer tablas en archivos PDF con IronOCR.

¿Listo para empezar?
Nuget Descargas 5,525,971 | Versión: 2026.3 recién lanzado
Still Scrolling Icon

¿Aún desplazándote?

¿Quieres una prueba rápida? PM > Install-Package IronOcr
ejecuta una muestra y observa cómo tu imagen se convierte en texto buscable.