Leia a tabela no documento.

Este exemplo de código demonstra como usar o mecanismo OCR IronTesseract para extrair texto e dados de tabela de um documento PDF.

  1. Uma instância do mecanismo OCR IronTesseract é criada.
  2. Um objeto OcrInput é inicializado e um arquivo PDF ("table.pdf") é carregado usando o método LoadPdf.
  3. O mecanismo OCR processa o documento usando o método ReadDocumentAdvanced, que retorna um objeto OcrResult mais detalhado.
  4. A primeira tabela encontrada no documento é acessada usando result.Tables.First(), e as informações da célula para essa tabela são extraídas com CellInfos.
  5. A lista de dados da célula (cellList) agora contém as células da tabela, incluindo o conteúdo do texto e outros detalhes (por exemplo, posição da célula, tamanho).
  6. Este método é útil para extrair dados estruturados, como tabelas, de PDFs, permitindo que o texto dentro de cada célula da tabela seja acessado e processado programaticamente.

Descubra como ler tabelas em PDFs com o IronOCR.

Pronto para começar?
Nuget Downloads 5,525,971 | Versão: 2026.3 acaba de ser lançado
Still Scrolling Icon

Ainda está rolando a tela?

Quer provas rápidas? PM > Install-Package IronOcr
executar um exemplo Veja sua imagem se transformar em texto pesquisável.