Dokümandaki Tabloyu Okuma
Bu kod örneği, IronTesseract OCR motorunu kullanarak bir PDF belgesinden metin ve tablo verilerini nasıl çıkarabileceğinizi gösterir.
IronTesseractOCR motorunun bir örneği oluşturulur.- Bir
OcrInputnesnesi başlatılır vetable.pdfyöntemi kullanılarak bir PDF dosyası (LoadPdf) yüklenir. - OCR motoru, daha ayrıntılı bir
OcrResultnesnesi döndürenReadDocumentAdvancedyöntemini kullanarak belgeyi işler. - Belgedeki ilk tabloya
result.Tables.First()kullanılarak erişilir ve bu tablonun hücre bilgileriCellInfosile çıkarılır. - Hücre verileri listesi (
cellList) artık metin içeriği ve diğer ayrıntılar (ör. hücre konumu, boyutu) dahil olmak üzere tablonun hücrelerini içerir. - Bu yöntem, her tablo hücresindeki metnin programlı olarak erişilip işlenmesine olanak tanıyan yapılandırılmış verileri, örneğin tabloları PDF'lerden çıkarmak için yararlıdır.
IronOCR ile PDF'lerdeki Tabloları Okumanın Yollarını Keşfedin.

