Leer tabla en documento
Este ejemplo de código demuestra cómo utilizar el motor OCR de IronTesseract para extraer texto y datos de tablas de un documento PDF.
Se crea una instancia del motor OCR de IronTesseract.
Se inicializa un objeto OcrInput, y un archivo PDF("table.pdf")se carga mediante el método LoadPdf.
El motor OCR procesa el documento usando el método ReadDocumentAdvanced, que devuelve un objeto OcrResult más detallado.
La primera tabla encontrada en el documento se accede utilizando result.Tables.First()y la información de la celda para esa tabla se extrae con CellInfos.
La lista de datos de celdas(listaDeCeldas)ahora contiene las celdas de la tabla, incluyendo el contenido de texto y otros detalles(por ejemplo, la posición de la celda, tamaño).
Este método es útil para extraer datos estructurados como tablas de archivos PDF, permitiendo que el texto dentro de cada celda de la tabla sea accedido y procesado programáticamente.