Lire le tableau dans le document Cet exemple de code montre comment utiliser le moteur OCR d'IronTesseract pour extraire du texte et des données de tableau d'un document PDF. Une instance du moteur OCR IronTesseract est créée. Un objet OcrInput est initialisé et un fichier PDF ("table.pdf") est chargé à l'aide de la méthode LoadPdf. Le moteur OCR traite le document à l'aide de la méthode ReadDocumentAdvanced, qui renvoie un objet OcrResult plus détaillé. Le premier tableau trouvé dans le document est accessible à l'aide de result.Tables.First(), et les informations sur les cellules de ce tableau sont extraites à l'aide de CellInfos. La liste des données des cellules (cellList) contient maintenant les cellules du tableau, y compris le contenu du texte et d'autres détails (par exemple, la position et la taille des cellules). Cette méthode est utile pour extraire des données structurées, telles que des tableaux, à partir de fichiers PDF, ce qui permet d'accéder au texte contenu dans chaque cellule du tableau et de le traiter de manière programmatique. Explorez comment lire les tableaux dans les PDF avec IronOCR. Liens de documentation associés Voir sur Github Tutoriel connexe Guide pratique connexe Documentation de classe Packs de langues pour OCR Télécharger IronOCR DLL Signaler un problème sur cette page Prêt à commencer? Nuget Téléchargements 5,044,537 | Version : 2025.11 vient de sortir Téléchargement gratuit NuGet Total des téléchargements :5,044,537 Voir Licences
Testez dans un environnement en direct Testez en production sans filigranes.Fonctionne où que vous en ayez besoin.
Produit entièrement fonctionnel Profitez de 30 jours de produit entièrement fonctionnel.Configurez-le et faites-le fonctionner en quelques minutes.
Testez dans un environnement en direct Testez en production sans filigranes.Fonctionne où que vous en ayez besoin.
Produit entièrement fonctionnel Profitez de 30 jours de produit entièrement fonctionnel.Configurez-le et faites-le fonctionner en quelques minutes.