Belgedeki Tabloyu Okuma
Bu kod örneği, bir PDF belgesinden metin ve tablo verilerini çıkarmak için IronTesseract OCR motorunun nasıl kullanılacağını göstermektedir.
IronTesseractOCR motorunun bir örneği oluşturulur.- Bir
OcrInputnesnesi başlatılır veLoadPdfyöntemi kullanılarak bir PDF dosyası ("table.pdf") yüklenir. - OCR motoru, belgeyi
ReadDocumentAdvancedyöntemi kullanarak işler, bu da daha ayrıntılı birOcrResultnesnesi döndürür. - Belgedeki ilk tabloya
result.Tables.First()kullanılarak erişilir ve bu tabloda yer alan hücre bilgisiCellInfosile çıkarılır. - Hücre verileri listesi (
cellList) şimdi metin içeriği ve diğer detaylar (örneğin, hücre konumu, boyutu) dahil olmak üzere tablonun hücrelerini içermektedir. - Bu yöntem, PDF'lerden tablolar gibi yapılandırılmış verileri çıkarmak için faydalıdır, her tablo hücresindeki metnin programatik olarak erişilmesine ve işlenmesine olanak tanır.
IronOCR ile PDF'lerdeki tabloları okumanın yollarını keşfedin.

