IronOCR Kullanarak Taranmış Görüntülerden Tablo Verilerini Çıkartma: Canlı Demo Özeti
Taralı görüntülerden veri çıkarmak, özellikle tablolar gibi yapılandırılmış veriler içerdiğinde yaygın bir zorluktur. IronOCR'un gelişmiş makine öğrenimi yetenekleri ile artık hücre değerleri ve bunların konumları gibi tablo verilerini sorunsuzca çıkarabilirsiniz. Bu demoda, Shadman Majid, Yazılım Satış Mühendisi, kodun uygulanmasını adım adım açıklarken, Anne Lazarakis, Satış ve Pazarlama Direktörü, Iron Software müşterilerinden gerçek dünya kullanım durumlarını paylaşmaktadır.
Gerçek Dünya Kullanım Durumları

Anne Lazarakis, Satış ve Pazarlama Direktörü tarafından açıklanmıştır*
Sigorta Talebi İşlemleri (Opyn Market)
ABD'deki yüksek derecede düzenlenmiş sağlık sigortası sektöründe, Opyn Market gibi şirketler halen birçok belgeyi faks ile almaktadır. Bu taranmış belgeler sıklıkla iç sistemlere doğru bir şekilde çıkarılıp girilmesi gereken tablo verilerini içerir. IronOCR ile bu işlemi otomatik hale getirip, manuel çalışmayı azaltarak insan hatası olasılığını ortadan kaldırabiliyorlar.
Lojistik ve Gıda Dağıtımı (iPAP)
ABD'deki en büyük peynir dağıtımcısı olan iPAP, 200'den fazla müşteri siparişini yönetmek için IronOCR'u kullanıyor. Faturaları, tutarsız tablo düzenleriyle çeşitli formatlarda gelir. IronOCR, taranmış belgelerden sipariş numaralarını, sevkiyat tarihlerini ve ürün ayrıntılarını eksiksiz bir şekilde çıkarmalarına yardımcı olur. Bu otomasyon onlara yıllık olarak 40.000 ila 45.000 dolar arasında tasarruf sağlamıştır.

Teknik Genel Bakış

Shadman Majid, Yazılım Satış Mühendisi ile Canlı Kodlama Oturumu*
IronOCR, taranmış belgelerden tablo verilerini tespit etmek ve çıkarmak için özel makine öğrenimi modelleri kullanır. Bu özellik şu konuları destekler:
- Tablo hücrelerinin ve koordinatlarının çıkarılması
- Taranmış görüntüler ve çok çerçeveli PDFlerin OCR'ı
- C#, VB.NET, .NET Standard, .NET Framework ve .NET Core ile uyumluluk

Bu işlevselliğe erişmek için şunlara ihtiyaçınız olacak:
IronOCRNuGet paketiIronOcr.Extensions.AdvancedScanningML modelleri aracılığıyla tablo algılama için NuGet paketi
Bu paketler, masa yapısını tespit etmek ve doğru OCR için gerekli eğitilmiş ML modellerini içerir.
Tabloları Çıkarmak İçin Örnek Kod
Aşağıda, IronOCR'u kullanarak görüntülerden tablo verilerini çıkarmayı gösteren bir örnek C# kod parçacığı bulunmaktadır:
// Import the necessary IronOCR namespaces
using IronOcr;
// Initialize the IronTesseract to handle OCR processes
var Ocr = new IronTesseract();
// Load the image containing the table
using (var input = new OcrInput("invoice.jpg"))
{
// Perform OCR and extract text data including tables
var result = Ocr.Read(input);
// Iterate through each page in the document
foreach (var page in result.Pages)
{
// Iterate through each table found on the page
foreach (var table in page.Tables)
{
Console.WriteLine("Table found:");
// Iterate through each row in the table
foreach (var row in table.Rows)
{
// Convert the row of cells to a comma-separated string
var cells = string.Join(", ", row.Cells.Select(cell => cell.Text));
Console.WriteLine(cells);
}
}
}
}
// Import the necessary IronOCR namespaces
using IronOcr;
// Initialize the IronTesseract to handle OCR processes
var Ocr = new IronTesseract();
// Load the image containing the table
using (var input = new OcrInput("invoice.jpg"))
{
// Perform OCR and extract text data including tables
var result = Ocr.Read(input);
// Iterate through each page in the document
foreach (var page in result.Pages)
{
// Iterate through each table found on the page
foreach (var table in page.Tables)
{
Console.WriteLine("Table found:");
// Iterate through each row in the table
foreach (var row in table.Rows)
{
// Convert the row of cells to a comma-separated string
var cells = string.Join(", ", row.Cells.Select(cell => cell.Text));
Console.WriteLine(cells);
}
}
}
}
' Import the necessary IronOCR namespaces
Imports IronOcr
' Initialize the IronTesseract to handle OCR processes
Private Ocr = New IronTesseract()
' Load the image containing the table
Using input = New OcrInput("invoice.jpg")
' Perform OCR and extract text data including tables
Dim result = Ocr.Read(input)
' Iterate through each page in the document
For Each page In result.Pages
' Iterate through each table found on the page
For Each table In page.Tables
Console.WriteLine("Table found:")
' Iterate through each row in the table
For Each row In table.Rows
' Convert the row of cells to a comma-separated string
Dim cells = String.Join(", ", row.Cells.Select(Function(cell) cell.Text))
Console.WriteLine(cells)
Next row
Next table
Next page
End Using
- Bir Resim Yükleniyor: Betik, IronTesseract motorunu başlatarak ve işlemek istediğiniz
invoice.jpgadlı bir resim dosyasını yükleyerek başlar. - OCR Uygulama: Girilere OCR uygulayarak metin verilerini, özellikle tabloya odaklanarak çıkarmaktadır.
- Tablo Çıkarma: Script, tespit edilen her tabloyu ve satırlarını iter, hücre içeriklerini yapılandırılmış bir şekilde çıkarır.
Bu betiği çalıştırmadan önce IronOCR için gerekli NuGet paketlerini yüklediğinizden emin olun.
Sonuç
IronOCR, kompleks tablo verilerini taranmış belgelerden çıkarmayı otomatikleştirmeyi kolaylaştırır. İster sağlık, lojistik, finans veya üretimde olun, bu çözüm güvenilirlik, doğruluk ve maliyet tasarruflu verimlilik sunar. Sadece birkaç satır kodla manuel veri girişini ortadan kaldırabilir ve insan hatasını azaltabilirsiniz.
Onu aksiyon halinde görmek ister misiniz? Mühendislerimizden biriyle canlı Demo'yu buradan rezerve edin.
Sıkça Sorulan Sorular
C# kullanarak taranmış görüntülerden tablo verilerini nasıl çıkarabilirim?
IronOCR'nin gelişmiş makine öğrenme yeteneklerini kullanarak, taranmış görüntülerden tablo verilerini çıkarabilirsiniz. Süreç, görüntüde OCR gerçekleştirmek ve hücre değerleri ile koordinatlarını çıkarmak için IronTesseract motorunu kullanmayı içerir.
Taranmış belgelerden tablo verilerini çıkarmanın gerçek dünya uygulamaları nelerdir?
Gerçek dünya uygulamaları arasında, gönderilen belgelerden tablo verilerini çıkararak sigorta talep işleme sürecinin otomatikleştirilmesi ve Opyn Market ve iPAP gibi şirketlerin gösterdiği gibi, faturaların çeşitli formatlarda geldiği ve tutarsız tablo düzenlerine sahip olduğu lojistikte müşteri siparişlerinin yönetilmesi yer alır.
IronOCR, tablo verilerini çıkarmak için hangi teknik yetenekleri sağlar?
IronOCR, tablo hücreleri ve koordinatlarının çıkarılması, taranmış görüntüler ve çok çerçeveli PDF'lerde OCR yapabilme ve C#, VB.NET, .NET Standard, .NET Framework ve .NET Core ile uyumluluk gibi yetenekler sunar.
IronOCR kullanarak tablo verilerini çıkarmak için kodda hangi adımlar yer alır?
Süreç, IronTesseract motorunu başlatmayı, görüntüyü yüklemeyi, metin verilerini çıkarmak için OCR yapmayı ve her algılanan tablo ve satırlarında gezinerek hücre içeriklerini çıkarmayı içerir.
IronOCR ile tablo verilerini çıkarmak için hangi paketlere ihtiyaç vardır?
Tablo algılama ve hassas OCR için gerekli olan eğitimli ML modellerini kullanmak adına IronOCR NuGet paketi ile birlikte IronOcr.Extensions.AdvancedScanning paketine ihtiyaçınız var.
IronOCR, sağlık ve lojistik endüstrilerinde verimliliği nasıl artırır?
IronOCR, taranmış belgelerden karmaşık tablo verilerini çıkarmayı otomatikleştirerek manuel işi ve insan hatasını azaltır ve sağlık ve lojistik gibi endüstriler için önemli verimlilik ve maliyet tasarrufları sağlar.
IronOCR'nin yeteneklerini canlı bir gösterimle görebilir miyim?
Evet, IronOCR'yi iş başında görmek ve tablo verilerini çıkartma konusundaki yeteneklerini öğrenmek için Iron Software'ın mühendislerinden biriyle canlı bir demo rezervasyonu yapabilirsiniz.



