Altbilgi içeriğine atla
IRONOCR KULLANıMı
HTML'den PDF'ye: C# .NET için Hızlı Bir Öğretici

IronOCR Kullanarak Taranmış Görüntülerden Tablo Verilerini Çıkartma: Canlı Demo Özeti

Taralı görüntülerden veri çıkarmak, özellikle tablolar gibi yapılandırılmış veriler içerdiğinde yaygın bir zorluktur. IronOCR'un gelişmiş makine öğrenimi yetenekleri ile artık hücre değerleri ve bunların konumları gibi tablo verilerini sorunsuzca çıkarabilirsiniz. Bu demoda, Shadman Majid, Yazılım Satış Mühendisi, kodun uygulanmasını adım adım açıklarken, Anne Lazarakis, Satış ve Pazarlama Direktörü, Iron Software müşterilerinden gerçek dünya kullanım durumlarını paylaşmaktadır.

Gerçek Dünya Kullanım Durumları

Ironocr Extract Table Data 4 related to Gerçek Dünya Kullanım Durumları

Anne Lazarakis, Satış ve Pazarlama Direktörü tarafından açıklanmıştır*

Sigorta Talebi İşlemleri (Opyn Market)

ABD'deki yüksek derecede düzenlenmiş sağlık sigortası sektöründe, Opyn Market gibi şirketler halen birçok belgeyi faks ile almaktadır. Bu taranmış belgeler sıklıkla iç sistemlere doğru bir şekilde çıkarılıp girilmesi gereken tablo verilerini içerir. IronOCR ile bu işlemi otomatik hale getirip, manuel çalışmayı azaltarak insan hatası olasılığını ortadan kaldırabiliyorlar.

Lojistik ve Gıda Dağıtımı (iPAP)

ABD'deki en büyük peynir dağıtımcısı olan iPAP, 200'den fazla müşteri siparişini yönetmek için IronOCR'u kullanıyor. Faturaları, tutarsız tablo düzenleriyle çeşitli formatlarda gelir. IronOCR, taranmış belgelerden sipariş numaralarını, sevkiyat tarihlerini ve ürün ayrıntılarını eksiksiz bir şekilde çıkarmalarına yardımcı olur. Bu otomasyon onlara yıllık olarak 40.000 ila 45.000 dolar arasında tasarruf sağlamıştır.

Ironocr Extract Table Data 2 related to Lojistik ve Gıda Dağıtımı (iPAP)


Teknik Genel Bakış

Ironocr Extract Table Data 5 related to Teknik Genel Bakış

Shadman Majid, Yazılım Satış Mühendisi ile Canlı Kodlama Oturumu*

IronOCR, taranmış belgelerden tablo verilerini tespit etmek ve çıkarmak için özel makine öğrenimi modelleri kullanır. Bu özellik şu konuları destekler:

  • Tablo hücrelerinin ve koordinatlarının çıkarılması
  • Taranmış görüntüler ve çok çerçeveli PDFlerin OCR'ı
  • C#, VB.NET, .NET Standard, .NET Framework ve .NET Core ile uyumluluk

Ironocr Extract Table Data 3 related to Teknik Genel Bakış

Bu işlevselliğe erişmek için şunlara ihtiyaçınız olacak:

Bu paketler, masa yapısını tespit etmek ve doğru OCR için gerekli eğitilmiş ML modellerini içerir.

Tabloları Çıkarmak İçin Örnek Kod

Aşağıda, IronOCR'u kullanarak görüntülerden tablo verilerini çıkarmayı gösteren bir örnek C# kod parçacığı bulunmaktadır:

// Import the necessary IronOCR namespaces
using IronOcr;

// Initialize the IronTesseract to handle OCR processes
var Ocr = new IronTesseract();

// Load the image containing the table
using (var input = new OcrInput("invoice.jpg"))
{
    // Perform OCR and extract text data including tables
    var result = Ocr.Read(input);

    // Iterate through each page in the document
    foreach (var page in result.Pages)
    {
        // Iterate through each table found on the page
        foreach (var table in page.Tables)
        {
            Console.WriteLine("Table found:");
            // Iterate through each row in the table
            foreach (var row in table.Rows)
            {
                // Convert the row of cells to a comma-separated string
                var cells = string.Join(", ", row.Cells.Select(cell => cell.Text));
                Console.WriteLine(cells);
            }
        }
    }
}
// Import the necessary IronOCR namespaces
using IronOcr;

// Initialize the IronTesseract to handle OCR processes
var Ocr = new IronTesseract();

// Load the image containing the table
using (var input = new OcrInput("invoice.jpg"))
{
    // Perform OCR and extract text data including tables
    var result = Ocr.Read(input);

    // Iterate through each page in the document
    foreach (var page in result.Pages)
    {
        // Iterate through each table found on the page
        foreach (var table in page.Tables)
        {
            Console.WriteLine("Table found:");
            // Iterate through each row in the table
            foreach (var row in table.Rows)
            {
                // Convert the row of cells to a comma-separated string
                var cells = string.Join(", ", row.Cells.Select(cell => cell.Text));
                Console.WriteLine(cells);
            }
        }
    }
}
' Import the necessary IronOCR namespaces
Imports IronOcr

' Initialize the IronTesseract to handle OCR processes
Private Ocr = New IronTesseract()

' Load the image containing the table
Using input = New OcrInput("invoice.jpg")
	' Perform OCR and extract text data including tables
	Dim result = Ocr.Read(input)

	' Iterate through each page in the document
	For Each page In result.Pages
		' Iterate through each table found on the page
		For Each table In page.Tables
			Console.WriteLine("Table found:")
			' Iterate through each row in the table
			For Each row In table.Rows
				' Convert the row of cells to a comma-separated string
				Dim cells = String.Join(", ", row.Cells.Select(Function(cell) cell.Text))
				Console.WriteLine(cells)
			Next row
		Next table
	Next page
End Using
$vbLabelText   $csharpLabel
  • Bir Resim Yükleniyor: Betik, IronTesseract motorunu başlatarak ve işlemek istediğiniz invoice.jpg adlı bir resim dosyasını yükleyerek başlar.
  • OCR Uygulama: Girilere OCR uygulayarak metin verilerini, özellikle tabloya odaklanarak çıkarmaktadır.
  • Tablo Çıkarma: Script, tespit edilen her tabloyu ve satırlarını iter, hücre içeriklerini yapılandırılmış bir şekilde çıkarır.

Bu betiği çalıştırmadan önce IronOCR için gerekli NuGet paketlerini yüklediğinizden emin olun.


Sonuç

IronOCR, kompleks tablo verilerini taranmış belgelerden çıkarmayı otomatikleştirmeyi kolaylaştırır. İster sağlık, lojistik, finans veya üretimde olun, bu çözüm güvenilirlik, doğruluk ve maliyet tasarruflu verimlilik sunar. Sadece birkaç satır kodla manuel veri girişini ortadan kaldırabilir ve insan hatasını azaltabilirsiniz.

Onu aksiyon halinde görmek ister misiniz? Mühendislerimizden biriyle canlı Demo'yu buradan rezerve edin.

Sıkça Sorulan Sorular

C# kullanarak taranmış görüntülerden tablo verilerini nasıl çıkarabilirim?

IronOCR'nin gelişmiş makine öğrenme yeteneklerini kullanarak, taranmış görüntülerden tablo verilerini çıkarabilirsiniz. Süreç, görüntüde OCR gerçekleştirmek ve hücre değerleri ile koordinatlarını çıkarmak için IronTesseract motorunu kullanmayı içerir.

Taranmış belgelerden tablo verilerini çıkarmanın gerçek dünya uygulamaları nelerdir?

Gerçek dünya uygulamaları arasında, gönderilen belgelerden tablo verilerini çıkararak sigorta talep işleme sürecinin otomatikleştirilmesi ve Opyn Market ve iPAP gibi şirketlerin gösterdiği gibi, faturaların çeşitli formatlarda geldiği ve tutarsız tablo düzenlerine sahip olduğu lojistikte müşteri siparişlerinin yönetilmesi yer alır.

IronOCR, tablo verilerini çıkarmak için hangi teknik yetenekleri sağlar?

IronOCR, tablo hücreleri ve koordinatlarının çıkarılması, taranmış görüntüler ve çok çerçeveli PDF'lerde OCR yapabilme ve C#, VB.NET, .NET Standard, .NET Framework ve .NET Core ile uyumluluk gibi yetenekler sunar.

IronOCR kullanarak tablo verilerini çıkarmak için kodda hangi adımlar yer alır?

Süreç, IronTesseract motorunu başlatmayı, görüntüyü yüklemeyi, metin verilerini çıkarmak için OCR yapmayı ve her algılanan tablo ve satırlarında gezinerek hücre içeriklerini çıkarmayı içerir.

IronOCR ile tablo verilerini çıkarmak için hangi paketlere ihtiyaç vardır?

Tablo algılama ve hassas OCR için gerekli olan eğitimli ML modellerini kullanmak adına IronOCR NuGet paketi ile birlikte IronOcr.Extensions.AdvancedScanning paketine ihtiyaçınız var.

IronOCR, sağlık ve lojistik endüstrilerinde verimliliği nasıl artırır?

IronOCR, taranmış belgelerden karmaşık tablo verilerini çıkarmayı otomatikleştirerek manuel işi ve insan hatasını azaltır ve sağlık ve lojistik gibi endüstriler için önemli verimlilik ve maliyet tasarrufları sağlar.

IronOCR'nin yeteneklerini canlı bir gösterimle görebilir miyim?

Evet, IronOCR'yi iş başında görmek ve tablo verilerini çıkartma konusundaki yeteneklerini öğrenmek için Iron Software'ın mühendislerinden biriyle canlı bir demo rezervasyonu yapabilirsiniz.

Kannaopat Udonpant
Yazılım Mühendisi
Yazılım Mühendisi olmadan önce, Kannapat Japonya'daki Hokkaido Üniversitesi'nden Çevresel Kaynaklar alanında doktora yaptı. Derecesini tamamlarken, Biyoprodüksiyon Mühendisliği Bölümü'nün bir parçası olan Taşıt Robotik Laboratuvarı'na da üye oldu. 2022'de, Iron Software mühendislik ekibine katılmak iç...
Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara