Leer tabla en documento Este ejemplo de código demuestra cómo usar el motor OCR de IronTesseract para extraer texto y datos de tablas de un documento PDF. Se crea una instancia del motor OCR de IronTesseract. Se inicializa un objeto OcrInput y se carga un archivo PDF ("table.pdf") utilizando el método LoadPdf. El motor OCR procesa el documento usando el método ReadDocumentAdvanced, que devuelve un objeto OcrResult más detallado. La primera tabla encontrada en el documento se accede utilizando result.Tables.First(), y se extrae la información de las celdas de esa tabla con CellInfos. La lista de datos de celdas (cellList) ahora contiene las celdas de la tabla, incluyendo el contenido del texto y otros detalles (por ejemplo, posición de la celda, tamaño). Este método es útil para extraer datos estructurados como tablas de los PDFs, permitiendo que el texto dentro de cada celda de la tabla sea accedido y procesado programáticamente. Descubra cómo leer tablas en archivos PDF con IronOCR. Enlaces de Documentos Ver en Github Tutorial Relacionado Guía de Cómo Hacer Relacionada Documentación de Clase Paquetes de Idioma OCR Descargar IronOCR DLL Reportar un problema en esta página ¿Listo para empezar? Nuget Descargas 5,167,857 | Version: 2025.11 recién lanzado Descarga Gratis de NuGet Descargas totales: 5,167,857 Ver Licencias
Producto completamente funcional Obtén 30 días de producto completamente funcional.Instálalo y ejecútalo en minutos.
Soporte técnico 24/5 Acceso completo a nuestro equipo de soporte técnico durante tu prueba del producto
Se responde a todas sus preguntas para asegurarse de que dispone de toda la información que necesita. (Sin ningún tipo de compromiso)