Altbilgi içeriğine atla
IRONOCR KULLANıMı

Makbuzlardan OCR Veri Çıkarma (Adım Adım Eğitim)

IronOCR kullanarak makbuz OCR yapmak, hem işletmeler hem de bireyler için oyunun kurallarını değiştirir. Bu süreç, fiziksel makbuzlardan önemli bilgileri çıkarmanıza ve bunları dijital verilere dönüştürmenize olanak tanır. Bu makale, IronOCR kullanarak makbuzlarınızdan en iyi şekilde nasıl yararlanacağınızı adım adım anlatacaktır.

OCR'ye Hızlı Bir Giriş

Optik Karakter Tanıma veya OCR, bilgisayarların görüntülerden veya taranmış belgelerden metin okumasını ve anlamasını sağlayan bir teknolojidir. Baskılı metni makine tarafından okunabilir metne dönüştürerek, OCR fiziksel belgelerdeki bilgileri depolamanıza, işlemenize ve analiz etmenize olanak tanır.

2. IronOCR'a Giriş

IronOCR, C# ve .NET geliştiricileri icin bir OCR (Optik Karakter Tanima) kutuphanesidir. Geliştiricilerin görüntülerden metin çıkarmalarına, PDF'lerden ve diğer belge formatlarından metin elde etmelerine olanak tanır. IronOCR, popüler Tesseract OCR engine üzerine inşa edilmiştir ve ek işlevsellikler ekleyerek, makbuz OCR dahil olmak üzere çeşitli uygulamalar için ideal bir seçenek haline gelmiştir.

3. Veri Çıkartma için IronOCR Kullanmanın Faydaları

IronOCR kullanarak makbuz verileri çıkarmanın bazı önemli avantajları şunlardır:

  • Yüksek doğruluk: IronOCR, makbuzlar ve diğer belgelerden güvenilir veri çıkarımı sağlamak için mükemmel OCR API doğruluğu sunar.
  • Çoklu dil desteği: IronOCR, 125'ten fazla dili destekleyerek küresel uygulamalar için uygun hale getirir.
  • Kullanımı kolay: Kütüphane, basit ve sezgisel bir API sunar, bu da geliştiricilerin projelerine OCR işlevselliğini kolayca entegre etmelerini sağlar.
  • Ozellestirilebilir: IronOCR, OCR sonuclarinin ince ayarini yapmak icin çeşitli seçenekler sunar, boylece ozel kullanim durumunuz icin optimal veri cikartimi saglar.

4. IronOCR Nasıl Çalışır

IronOCR, resimlerden ve belgelerden metin tanımak ve çıkarmak için gelişmiş OCR algoritmalarını kullanır. JPEG, PNG, TIFF ve PDF dahil çeşitli formatları işleyebilir. Kutuphanemiz, girdiyi dosyayı okur, içindeki metni tanır ve çıkarılan metni bir dizi olarak çıktılar; bu dizi ardından gerektiği şekilde işlenebilir veya depolanabilir. IronOCR, en iyi sonuçlar için bilgisayarla görme kullanır.

5. IronOCR Kullanımı İçin Ön Koşullar

Makbuz verisi çıkarmaya başlamak için öncelikle IronOCR paketini yüklemeniz gerekecek. Bu, .NET için paket yöneticisi olan NuGet üzerinden kolayca yapılabilir. Projenizi Visual Studio'da açın ve şu adımları izleyin:

  1. Projenize Çözüm Gezgini'nde sağ tıklayın ve 'NuGet Paketlerini Yönet'i seçin.
  2. NuGet Paket Yöneticisi penceresinde "IronOCR" arayın.
  3. IronOcr paketini seçin ve "Yükle"ye tıklayın.

    OCR Makbuz Verisi Çıkarımı (Adım Adım Kılavuz), Şekil 1: NuGet Paket Yöneticisi UI'de IronOcr paketini arayın NuGet Paket Yöneticisi UI'de IronOcr paketini arayın

6. Makbuz Görselini Hazırlama

Maktan veri çıkarmadan önce, makbuz görüntülerinin yüksek kalitede olduğundan emin olmak istersiniz. Bu, makbuz OCR API sürecinin doğruluğunu artırmak için önemlidir. Işte makbuzunuzun iyi bir görüntüsünü yakalamak için bazı ipuçları:

  1. Taranmış bir belge kullanın. Fiş taraması için yüksek çözünürlüklü bir tarayıcı kullanabilirsiniz.
  2. Makbuzun iyi aydınlatıldığından ve gölgelerden uzak olduğundan emin olun.
  3. Faturadaki herhangi bir buruşukluk veya kıvrımı düzeltin, böylece önemli bilgi gizlenmiş olmasın.
  4. Makbuz üzerindeki metnin net ve leke olmamasını sağlayarak, makbuz işleme sürecini iyileştirin.

    OCR Makbuz Verisi Çıkarımı (Adım Adım Kılavuz), Şekil 2: Metin çıkarımı için örnek makbuz görseli Metin çıkarmak için örnek makbuz görüntüsü

7. Makbuz Görüntüsünde OCR Gerçekleştirme

IronOCR yüklendiğinde ve makbuz görseliniz hazır olduğunda, OCR işlemini gerçekleştirme zamanı gelmiştir. .NET uygulamanızda aşağıdaki kod parçasını kullanın:

using IronOcr;

// Initialize the IronTesseract class, which is responsible for OCR operations
var ocr = new IronTesseract();

// Use the OcrInput class to load the image of your receipt.
// Replace @"path/to/your/receipt/image.png" with the actual file path.
using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
{
    // Read the content of the image and perform OCR recognition
    var result = ocr.Read(ocrInput);

    // Output the recognized text to the console
    Console.WriteLine(result.Text);
}
using IronOcr;

// Initialize the IronTesseract class, which is responsible for OCR operations
var ocr = new IronTesseract();

// Use the OcrInput class to load the image of your receipt.
// Replace @"path/to/your/receipt/image.png" with the actual file path.
using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
{
    // Read the content of the image and perform OCR recognition
    var result = ocr.Read(ocrInput);

    // Output the recognized text to the console
    Console.WriteLine(result.Text);
}
Imports IronOcr

' Initialize the IronTesseract class, which is responsible for OCR operations
Private ocr = New IronTesseract()

' Use the OcrInput class to load the image of your receipt.
' Replace @"path/to/your/receipt/image.png" with the actual file path.
Using ocrInput As New OcrInput("path/to/your/receipt/image.png")
	' Read the content of the image and perform OCR recognition
	Dim result = ocr.Read(ocrInput)

	' Output the recognized text to the console
	Console.WriteLine(result.Text)
End Using
$vbLabelText   $csharpLabel

Kod Açıklaması

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

Bu satır, IronOCR kutuphanesini .NET uygulamanıza aktararak özelliklerine erişmenizi sağlar.

var ocr = new IronTesseract();
var ocr = new IronTesseract();
Dim ocr = New IronTesseract()
$vbLabelText   $csharpLabel

Bu satır, IronOCR'da OCR işlemlerinden sorumlu ana sınıf olan IronTesseract sınıfının yeni bir örneğini oluşturur.

using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
Using ocrInput As New OcrInput("path/to/your/receipt/image.png")
$vbLabelText   $csharpLabel

Burada, OCR süreci için girdi görselini temsil eden OcrInput sınıfının yeni bir örneği oluşturulur. @"path/to/your/receipt/image.png" kendi makbuz görüntünüzün dosya yolu ile değiştirilmelidir. using ifadesi, OCR işlemi tamamlandıktan sonra OcrInput örneğine tahsis edilen kaynakların düzgün bir şekilde serbest bırakılmasını sağlar.

var result = ocr.Read(ocrInput);
var result = ocr.Read(ocrInput);
Dim result = ocr.Read(ocrInput)
$vbLabelText   $csharpLabel

Bu satır, IronTesseract örneğinin Read metodunu çağırır ve parametre olarak OcrInput nesnesini geçirir. Read yöntemi, giriş görselini işler ve OCR işlemini gerçekleştirir, görselden metin tanıma ve çıkarma işlemi yapar. Fatura tanıma sürecini başlatacak.

Console.WriteLine(result.Text);
Console.WriteLine(result.Text);
Console.WriteLine(result.Text)
$vbLabelText   $csharpLabel

Son olarak, bu satır çıkarılan metni konsola yazdırır. OcrResult sınıfının bir örneği olan result nesnesi, tanınan metni ve OCR süreci hakkında ek bilgileri içerir. Çıkarılan metin, result nesnesinin Text özelliğine erişilerek görüntülenebilir.

OCR Makbuz Verisi Çıkarımı (Adım Adım Kılavuz), Şekil 3: Çıkarılan metinlerin çıktısı Çıkarılan metinlerin çıktısı

OCR Sonuçlarını İnce Ayarlama

IronOCR, OCR doğruluğunu ve performansını artırmak için birkaç seçenek sunar. Bunlar, resmi önceden işleme tabi tutma, OCR motoru ayarlarını ayarlama ve makbuzunuz için uygun dili seçmeyi içerir.

Görüntü Ön-İşleme

Görüntü ön işleme tekniklerini uygulayarak OCR sonuçlarını iyileştirebilirsiniz:

  1. Eğriltmeyi Düzeltme: Görüntüdeki döndürme veya eğikliği düzeltin.
  2. Gürültü Azaltma: Resimlerden gürültüyü kaldırarak metnin okunabilirliğini artırın.

Bu tekniklerin nasıl uygulanacağına dair bir örnek:

using IronOcr;

// Initialize the IronTesseract class
var ocr = new IronTesseract();

// Load the image of your receipt and apply preprocessing techniques
using (var input = new OcrInput(@"path/to/your/receipt/image.png"))
{
    input.DeNoise(); // Remove noise from the image
    input.DeSkew();  // Correct any skewing in the image

    // Perform OCR and extract the recognized text
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
using IronOcr;

// Initialize the IronTesseract class
var ocr = new IronTesseract();

// Load the image of your receipt and apply preprocessing techniques
using (var input = new OcrInput(@"path/to/your/receipt/image.png"))
{
    input.DeNoise(); // Remove noise from the image
    input.DeSkew();  // Correct any skewing in the image

    // Perform OCR and extract the recognized text
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
Imports IronOcr

' Initialize the IronTesseract class
Private ocr = New IronTesseract()

' Load the image of your receipt and apply preprocessing techniques
Using input = New OcrInput("path/to/your/receipt/image.png")
	input.DeNoise() ' Remove noise from the image
	input.DeSkew() ' Correct any skewing in the image

	' Perform OCR and extract the recognized text
	Dim result = ocr.Read(input)
	Console.WriteLine(result.Text)
End Using
$vbLabelText   $csharpLabel

Dil Seçimi

IronOCR, makbuzunuz için doğru dili seçmek, OCR sonuçlarını önemli ölçüde iyileştirebilir ve 125'ten fazla dili destekler. Dili belirlemek için kodunuza aşağıdaki satırı ekleyin:

ocr.Configuration.Language = OcrLanguage.English;
ocr.Configuration.Language = OcrLanguage.English;
ocr.Configuration.Language = OcrLanguage.English
$vbLabelText   $csharpLabel

OCR Sonuçlarından Veri Çıkarma

OCR işlemi tamamlandığında, metinden belirli bilgileri çıkarmanın zamanı gelmiştir. İhtiyaçlarınıza bağlı olarak, aşağıdaki gibi verileri çıkarmak isteyebilirsiniz:

  1. Mağaza adı ve adresi.
  2. Satın alma tarihi ve saati.
  3. Ürün adları ve fiyatları.
  4. Ara toplam, vergi ve toplam tutar.

Bunu yapmak için .NET uygulamanızda, normal ifadeleri veya dize manipülasyon tekniklerini kullanabilirsiniz. Örneğin, OCR sonucundan tarihi aşağıdaki kod parçasını kullanarak çıkarabilirsiniz:

using System;
using System.Text.RegularExpressions;

// Define a regular expression pattern for matching dates
var datePattern = @"\d{1,2}\/\d{1,2}\/\d{2,4}";

// Search for a date in the OCR result text
var dateMatch = Regex.Match(result.Text, datePattern);
if (dateMatch.Success)
{
    // Parse the matched date string into a DateTime object
    var dateValue = DateTime.Parse(dateMatch.Value);
    Console.WriteLine("Date: " + dateValue);
}
using System;
using System.Text.RegularExpressions;

// Define a regular expression pattern for matching dates
var datePattern = @"\d{1,2}\/\d{1,2}\/\d{2,4}";

// Search for a date in the OCR result text
var dateMatch = Regex.Match(result.Text, datePattern);
if (dateMatch.Success)
{
    // Parse the matched date string into a DateTime object
    var dateValue = DateTime.Parse(dateMatch.Value);
    Console.WriteLine("Date: " + dateValue);
}
Imports System
Imports System.Text.RegularExpressions

' Define a regular expression pattern for matching dates
Private datePattern = "\d{1,2}\/\d{1,2}\/\d{2,4}"

' Search for a date in the OCR result text
Private dateMatch = Regex.Match(result.Text, datePattern)
If dateMatch.Success Then
	' Parse the matched date string into a DateTime object
	Dim dateValue = DateTime.Parse(dateMatch.Value)
	Console.WriteLine("Date: " & dateValue)
End If
$vbLabelText   $csharpLabel

Makbuzdan çıkarmanız gereken diğer bilgiler için benzer kalıplar oluşturabilirsiniz.

Çıkarılan Verileri Saklama ve Analiz Etme

Makbuzunuzdan ilgili bilgileri çıkardıktan sonra, bu bilgileri bir veritabanına kaydedebilir, analiz edebilir veya CSV, JSON veya Excel gibi diğer dosya formatlarına aktarabilirsiniz.

Sonuç

Sonuç olarak, IronOCR kullanarak Makbuz OCR, finansal verilerinizi dijitalleştirmek ve yönetmek için yenilikçi ve verimli bir çözümdür. IronOCR ile manuel veri girişini değiştirebilirsiniz. Bu adım adım kılavuzu izleyerek, IronOCR'un gücünden yararlanarak masraf takibinizi ve veri analizini geliştirebilirsiniz. En iyi yanı, IronOCR'un bir ücretsiz deneme sunmasıdır, bu sayede taahhütsüz olarak yeteneklerini deneyimleyebilirsiniz.

Deneme süresi sona erdikten sonra, IronOCR kullanmaya devam etmeye karar verirseniz, lisans $799 tarihinden başlar ve uygulamalarınızda OCR teknolojisinin avantajlarını uygun maliyetli bir şekilde kullanma imkanı sağlar.

Sıkça Sorulan Sorular

Bir fis görüntüsunu C# kullanarak dijital metne nasil dönüştürurum?

IronOCR'u kullanarak bir fis görüntüsunu dijital metne dönüştürebilirsiniz. IronTesseract sınıfini baslatarak, görüntüyu OcrInput ile yukleyip Read metodunu cagirarak metni çıkarin.

Optik Karakter Tanima nedir ve fisklar için nasil calisir?

Optik Karakter Tanima (OCR), görüntülerden veya taranmis belgelerden metni makineler tarafindan okunabilir verilere dönüştüren bir teknolojidir. Fisklar için, basili materyali tarar ve IronOCR kullanarak depolanip analiz edilebilecek metne cevirir.

Fis görüntüleri için OCR sonuc kalitesini nasil iyilestiririm?

OCR sonuclarini iyilestirmek, fis görüntülerinin yüksek kaliteli oldugundan emin olmak, deskewing ve denoising gibi görsel on işleme tekniklerini kullanmak, ve IronOCR'de doğru dil ayarlarini secmek ile saglanabilir.

Fis verisi çıkarmak için bir C# OCR kütüphanesi kullanmanin avantajlari nelerdir?

IronOCR gibi bir C# OCR kütüphanesi kullanmak, 125'ten fazla dili destekleme, yüksek doğruluk ve özellestirme seçenekleri sunarak fis verisi çıkarmayi iyilestirir, .NET projelerine kolayca entegre olmasini saglar.

Çıkarilan fis verisi raporlama ve analiz için nasil kullanilabilir?

Çıkarilan fis verisi veritabanlarina kaydedilebilir veya CSV, JSON, ya da Excel gibi formatlara ihrac edilebilir, bu da daha ileri işleme, raporlama ve analiz imkani saglar.

Bir .NET ortaminda bir OCR kütüphanesi kurulumu için prosedur nedir?

IronOCR'u bir .NET ortaminda kurmak için, Visual Studio'yu acin, 'NuGet Paketlerini Yönetin' bölümune gidin, 'IronOCR' aramasi yapin ve projenize yukleyin.

Fisler için OCR ciktilarindan belirli veriler nasil çıkarilir?

Fisler için OCR ciktilarindan belirli veriler, duzenli ifadeler veya string manipulasyonu kullanarak magaza adlari, satın alma tarihleri ve ürün fiyatlari gibi bilgileri analiz ederek çıkarilabilir.

Fis verisi OCR'da yaygin zorluklar nelerdir ve bunlar nasil halledilebilir?

Yaygin zorluklar, dusuk görüntü kalitesi ve karmaşik firin düzenleridir. Bu, görüntü kalitesini artırarak, ön işleme tekniklerini kullanarak ve IronOCR'deki özellestirme seçeneklerinden yararlanarak çözümlenebilir.

Fis OCR için IronOCR çok dilli desteği sagliyor mu?

Evet, IronOCR fis OCR için çok dilli desteği saglayarak, 125'ten fazla dilde metin tanimasi ve işlemesi saglayarak global uygulamalar için etkinligini arttirir.

C# OCR kütüphanesi için deneme sürümu mevcut mu ve lisanslama seçenekleri nelerdir?

IronOCR, kullanicilarin özelliklerini kesfetmesine olanak taniyan ücretsiz bir deneme sürümu sunar. Deneme sonrasinda, ekonomik bir lite sürümle baslayan çeşitli lisanslama seçenekleri mevcuttur.

Kannaopat Udonpant
Yazılım Mühendisi
Yazılım Mühendisi olmadan önce, Kannapat Japonya'daki Hokkaido Üniversitesi'nden Çevresel Kaynaklar alanında doktora yaptı. Derecesini tamamlarken, Biyoprodüksiyon Mühendisliği Bölümü'nün bir parçası olan Taşıt Robotik Laboratuvarı'na da üye oldu. 2022'de, Iron Software mühendislik ekibine katılmak iç...
Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara