Tabelle im Dokument lesen

VB C#

using IronOcr;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var input = new OcrInput();
input.LoadPdf("table.pdf");

// Perform OCR
var result = ocr.ReadDocumentAdvanced(input);

var cellList = result.Tables.First().CellInfos;

Imports IronOcr
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private input = New OcrInput()
input.LoadPdf("table.pdf")

' Perform OCR
Dim result = ocr.ReadDocumentAdvanced(input)

Dim cellList = result.Tables.First().CellInfos

Install-Package IronOcr

Tabelle im Dokument lesen

Dieses Codebeispiel zeigt, wie der IronTesseract OCR-Engine verwendet wird, um Text und Tabellendaten aus einem PDF-Dokument zu extrahieren.

Eine Instanz der IronTesseract OCR-Engine wird erstellt.
Ein OcrInput Objekt wird initialisiert und eine PDF-Datei (table.pdf) wird mithilfe der LoadPdf Methode geladen.
Die OCR-Engine verarbeitet das Dokument mithilfe der ReadDocumentAdvanced Methode, die ein detaillierteres OcrResult Objekt zurückgibt.
Die erste im Dokument gefundene Tabelle wird über result.Tables.First() abgerufen. Die Zellinformationen dieser Tabelle werden mit CellInfos extrahiert.
Die Liste der Zelldaten (cellList) enthält jetzt die Zellen der Tabelle, einschließlich des Textinhalts und anderer Details (z.B. Zellposition, Größe).
Diese Methode ist nützlich, um strukturierte Daten wie Tabellen aus PDFs zu extrahieren, sodass der Text innerhalb jeder Tabellenzelle programmatisch zugänglich und verarbeitbar ist.

Erfahren Sie, wie Sie mit IronOCR Tabellen in PDFs lesen können.

Bereit anzufangen?

Nuget Downloads 6,136,090 | Version: 2026.7 gerade veröffentlicht

Lizenzen anzeigen

Scrollst du immer noch?

Sie brauchen schnell einen Beweis? PM > Install-Package IronOcr
Führen Sie ein Beispiel aus und beobachten Sie, wie Ihr Bild zu durchsuchbarem Text wird.