Tabelle im Dokument lesen Dieses Codebeispiel zeigt, wie die IronTesseract OCR-Engine verwendet wird, um Text- und Tabellendaten aus einem PDF-Dokument zu extrahieren. Eine Instanz der IronTesseract OCR-Engine wird erstellt. Ein OcrInput-Objekt wird initialisiert und eine PDF-Datei ("table.pdf") wird mit der LoadPdf-Methode geladen. Die OCR-Engine verarbeitet das Dokument mit der ReadDocumentAdvanced-Methode, die ein detaillierteres OcrResult-Objekt zurückgibt. Die erste im Dokument gefundene Tabelle wird mit result.Tables.First() abgerufen und die Zellinformationen für diese Tabelle werden mit CellInfos extrahiert. Die Liste der Zellen (cellList) enthält nun die Zellen der Tabelle, einschließlich des Textinhalts und anderer Details (z. B. Zellposition, Größe). Diese Methode ist nützlich, um strukturierte Daten wie Tabellen aus PDFs zu extrahieren, sodass der Text innerhalb jeder Tabellenzelle programmatisch zugänglich und verarbeitbar ist. Erkunden Sie, wie Sie Tabellen in PDFs mit IronOCR lesen können. Verwandte Doku-Links Auf Github ansehen Verwandtes Tutorial Verwandte Anleitung Klassendokumentation OCR-Sprachpakete IronOCR DLL herunterladen Ein Problem auf dieser Seite melden Bereit anzufangen? Nuget Downloads 5,044,537 | Version: 2025.11 gerade veröffentlicht Kostenloser NuGet-Download Gesamtanzahl der Downloads: 5,044,537 Lizenzen anzeigen
In einer Live-Umgebung testen Testen Sie ohne Wasserzeichen in der Produktion.Funktioniert dort, wo Sie es brauchen.
Voll funktionsfähiges Produkt Erhalten Sie 30 Tage voll funktionsfähiges Produkt.In wenigen Minuten einsatzbereit.
24/5 technischer Support Voller Zugriff auf unser Support-Engineering-Team während Ihrer Produktprobe
In einer Live-Umgebung testen Testen Sie ohne Wasserzeichen in der Produktion.Funktioniert dort, wo Sie es brauchen.
Voll funktionsfähiges Produkt Erhalten Sie 30 Tage voll funktionsfähiges Produkt.In wenigen Minuten einsatzbereit.
24/5 technischer Support Voller Zugriff auf unser Support-Engineering-Team während Ihrer Produktprobe