Makbuzlardan OCR Veri Çıkarma (Adım Adım Eğitim)
IronOCR kullanarak makbuz OCR yapmak, hem işletmeler hem de bireyler için oyunun kurallarını değiştirir. Bu süreç, fiziksel makbuzlardan önemli bilgileri çıkarmanıza ve bunları dijital verilere dönüştürmenize olanak tanır. Bu makale, IronOCR kullanarak makbuzlarınızdan en iyi şekilde nasıl yararlanacağınızı adım adım anlatacaktır.
OCR'ye Hızlı Bir Giriş
Optik Karakter Tanıma veya OCR, bilgisayarların görüntülerden veya taranmış belgelerden metin okumasını ve anlamasını sağlayan bir teknolojidir. Baskılı metni makine tarafından okunabilir metne dönüştürerek, OCR fiziksel belgelerdeki bilgileri depolamanıza, işlemenize ve analiz etmenize olanak tanır.
2. IronOCR'a Giriş
IronOCR, C# ve .NET geliştiricileri icin bir OCR (Optik Karakter Tanima) kutuphanesidir. Geliştiricilerin görüntülerden metin çıkarmalarına, PDF'lerden ve diğer belge formatlarından metin elde etmelerine olanak tanır. IronOCR, popüler Tesseract OCR engine üzerine inşa edilmiştir ve ek işlevsellikler ekleyerek, makbuz OCR dahil olmak üzere çeşitli uygulamalar için ideal bir seçenek haline gelmiştir.
3. Veri Çıkartma için IronOCR Kullanmanın Faydaları
IronOCR kullanarak makbuz verileri çıkarmanın bazı önemli avantajları şunlardır:
- Yüksek doğruluk: IronOCR, makbuzlar ve diğer belgelerden güvenilir veri çıkarımı sağlamak için mükemmel OCR API doğruluğu sunar.
- Çoklu dil desteği: IronOCR, 125'ten fazla dili destekleyerek küresel uygulamalar için uygun hale getirir.
- Kullanımı kolay: Kütüphane, basit ve sezgisel bir API sunar, bu da geliştiricilerin projelerine OCR işlevselliğini kolayca entegre etmelerini sağlar.
- Ozellestirilebilir: IronOCR, OCR sonuclarinin ince ayarini yapmak icin çeşitli seçenekler sunar, boylece ozel kullanim durumunuz icin optimal veri cikartimi saglar.
4. IronOCR Nasıl Çalışır
IronOCR, resimlerden ve belgelerden metin tanımak ve çıkarmak için gelişmiş OCR algoritmalarını kullanır. JPEG, PNG, TIFF ve PDF dahil çeşitli formatları işleyebilir. Kutuphanemiz, girdiyi dosyayı okur, içindeki metni tanır ve çıkarılan metni bir dizi olarak çıktılar; bu dizi ardından gerektiği şekilde işlenebilir veya depolanabilir. IronOCR, en iyi sonuçlar için bilgisayarla görme kullanır.
5. IronOCR Kullanımı İçin Ön Koşullar
Makbuz verisi çıkarmaya başlamak için öncelikle IronOCR paketini yüklemeniz gerekecek. Bu, .NET için paket yöneticisi olan NuGet üzerinden kolayca yapılabilir. Projenizi Visual Studio'da açın ve şu adımları izleyin:
- Projenize Çözüm Gezgini'nde sağ tıklayın ve 'NuGet Paketlerini Yönet'i seçin.
- NuGet Paket Yöneticisi penceresinde "IronOCR" arayın.
-
IronOcrpaketini seçin ve "Yükle"ye tıklayın.
NuGet Paket Yöneticisi UI'de IronOcrpaketini arayın
6. Makbuz Görselini Hazırlama
Maktan veri çıkarmadan önce, makbuz görüntülerinin yüksek kalitede olduğundan emin olmak istersiniz. Bu, makbuz OCR API sürecinin doğruluğunu artırmak için önemlidir. Işte makbuzunuzun iyi bir görüntüsünü yakalamak için bazı ipuçları:
- Taranmış bir belge kullanın. Fiş taraması için yüksek çözünürlüklü bir tarayıcı kullanabilirsiniz.
- Makbuzun iyi aydınlatıldığından ve gölgelerden uzak olduğundan emin olun.
- Faturadaki herhangi bir buruşukluk veya kıvrımı düzeltin, böylece önemli bilgi gizlenmiş olmasın.
-
Makbuz üzerindeki metnin net ve leke olmamasını sağlayarak, makbuz işleme sürecini iyileştirin.
Metin çıkarmak için örnek makbuz görüntüsü
7. Makbuz Görüntüsünde OCR Gerçekleştirme
IronOCR yüklendiğinde ve makbuz görseliniz hazır olduğunda, OCR işlemini gerçekleştirme zamanı gelmiştir. .NET uygulamanızda aşağıdaki kod parçasını kullanın:
using IronOcr;
// Initialize the IronTesseract class, which is responsible for OCR operations
var ocr = new IronTesseract();
// Use the OcrInput class to load the image of your receipt.
// Replace @"path/to/your/receipt/image.png" with the actual file path.
using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
{
// Read the content of the image and perform OCR recognition
var result = ocr.Read(ocrInput);
// Output the recognized text to the console
Console.WriteLine(result.Text);
}
using IronOcr;
// Initialize the IronTesseract class, which is responsible for OCR operations
var ocr = new IronTesseract();
// Use the OcrInput class to load the image of your receipt.
// Replace @"path/to/your/receipt/image.png" with the actual file path.
using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
{
// Read the content of the image and perform OCR recognition
var result = ocr.Read(ocrInput);
// Output the recognized text to the console
Console.WriteLine(result.Text);
}
Imports IronOcr
' Initialize the IronTesseract class, which is responsible for OCR operations
Private ocr = New IronTesseract()
' Use the OcrInput class to load the image of your receipt.
' Replace @"path/to/your/receipt/image.png" with the actual file path.
Using ocrInput As New OcrInput("path/to/your/receipt/image.png")
' Read the content of the image and perform OCR recognition
Dim result = ocr.Read(ocrInput)
' Output the recognized text to the console
Console.WriteLine(result.Text)
End Using
Kod Açıklaması
using IronOcr;
using IronOcr;
Imports IronOcr
Bu satır, IronOCR kutuphanesini .NET uygulamanıza aktararak özelliklerine erişmenizi sağlar.
var ocr = new IronTesseract();
var ocr = new IronTesseract();
Dim ocr = New IronTesseract()
Bu satır, IronOCR'da OCR işlemlerinden sorumlu ana sınıf olan IronTesseract sınıfının yeni bir örneğini oluşturur.
using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
Using ocrInput As New OcrInput("path/to/your/receipt/image.png")
Burada, OCR süreci için girdi görselini temsil eden OcrInput sınıfının yeni bir örneği oluşturulur. @"path/to/your/receipt/image.png" kendi makbuz görüntünüzün dosya yolu ile değiştirilmelidir. using ifadesi, OCR işlemi tamamlandıktan sonra OcrInput örneğine tahsis edilen kaynakların düzgün bir şekilde serbest bırakılmasını sağlar.
var result = ocr.Read(ocrInput);
var result = ocr.Read(ocrInput);
Dim result = ocr.Read(ocrInput)
Bu satır, IronTesseract örneğinin Read metodunu çağırır ve parametre olarak OcrInput nesnesini geçirir. Read yöntemi, giriş görselini işler ve OCR işlemini gerçekleştirir, görselden metin tanıma ve çıkarma işlemi yapar. Fatura tanıma sürecini başlatacak.
Console.WriteLine(result.Text);
Console.WriteLine(result.Text);
Console.WriteLine(result.Text)
Son olarak, bu satır çıkarılan metni konsola yazdırır. OcrResult sınıfının bir örneği olan result nesnesi, tanınan metni ve OCR süreci hakkında ek bilgileri içerir. Çıkarılan metin, result nesnesinin Text özelliğine erişilerek görüntülenebilir.
Çıkarılan metinlerin çıktısı
OCR Sonuçlarını İnce Ayarlama
IronOCR, OCR doğruluğunu ve performansını artırmak için birkaç seçenek sunar. Bunlar, resmi önceden işleme tabi tutma, OCR motoru ayarlarını ayarlama ve makbuzunuz için uygun dili seçmeyi içerir.
Görüntü Ön-İşleme
Görüntü ön işleme tekniklerini uygulayarak OCR sonuçlarını iyileştirebilirsiniz:
- Eğriltmeyi Düzeltme: Görüntüdeki döndürme veya eğikliği düzeltin.
- Gürültü Azaltma: Resimlerden gürültüyü kaldırarak metnin okunabilirliğini artırın.
Bu tekniklerin nasıl uygulanacağına dair bir örnek:
using IronOcr;
// Initialize the IronTesseract class
var ocr = new IronTesseract();
// Load the image of your receipt and apply preprocessing techniques
using (var input = new OcrInput(@"path/to/your/receipt/image.png"))
{
input.DeNoise(); // Remove noise from the image
input.DeSkew(); // Correct any skewing in the image
// Perform OCR and extract the recognized text
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
// Initialize the IronTesseract class
var ocr = new IronTesseract();
// Load the image of your receipt and apply preprocessing techniques
using (var input = new OcrInput(@"path/to/your/receipt/image.png"))
{
input.DeNoise(); // Remove noise from the image
input.DeSkew(); // Correct any skewing in the image
// Perform OCR and extract the recognized text
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
' Initialize the IronTesseract class
Private ocr = New IronTesseract()
' Load the image of your receipt and apply preprocessing techniques
Using input = New OcrInput("path/to/your/receipt/image.png")
input.DeNoise() ' Remove noise from the image
input.DeSkew() ' Correct any skewing in the image
' Perform OCR and extract the recognized text
Dim result = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Dil Seçimi
IronOCR, makbuzunuz için doğru dili seçmek, OCR sonuçlarını önemli ölçüde iyileştirebilir ve 125'ten fazla dili destekler. Dili belirlemek için kodunuza aşağıdaki satırı ekleyin:
ocr.Configuration.Language = OcrLanguage.English;
ocr.Configuration.Language = OcrLanguage.English;
ocr.Configuration.Language = OcrLanguage.English
OCR Sonuçlarından Veri Çıkarma
OCR işlemi tamamlandığında, metinden belirli bilgileri çıkarmanın zamanı gelmiştir. İhtiyaçlarınıza bağlı olarak, aşağıdaki gibi verileri çıkarmak isteyebilirsiniz:
- Mağaza adı ve adresi.
- Satın alma tarihi ve saati.
- Ürün adları ve fiyatları.
- Ara toplam, vergi ve toplam tutar.
Bunu yapmak için .NET uygulamanızda, normal ifadeleri veya dize manipülasyon tekniklerini kullanabilirsiniz. Örneğin, OCR sonucundan tarihi aşağıdaki kod parçasını kullanarak çıkarabilirsiniz:
using System;
using System.Text.RegularExpressions;
// Define a regular expression pattern for matching dates
var datePattern = @"\d{1,2}\/\d{1,2}\/\d{2,4}";
// Search for a date in the OCR result text
var dateMatch = Regex.Match(result.Text, datePattern);
if (dateMatch.Success)
{
// Parse the matched date string into a DateTime object
var dateValue = DateTime.Parse(dateMatch.Value);
Console.WriteLine("Date: " + dateValue);
}
using System;
using System.Text.RegularExpressions;
// Define a regular expression pattern for matching dates
var datePattern = @"\d{1,2}\/\d{1,2}\/\d{2,4}";
// Search for a date in the OCR result text
var dateMatch = Regex.Match(result.Text, datePattern);
if (dateMatch.Success)
{
// Parse the matched date string into a DateTime object
var dateValue = DateTime.Parse(dateMatch.Value);
Console.WriteLine("Date: " + dateValue);
}
Imports System
Imports System.Text.RegularExpressions
' Define a regular expression pattern for matching dates
Private datePattern = "\d{1,2}\/\d{1,2}\/\d{2,4}"
' Search for a date in the OCR result text
Private dateMatch = Regex.Match(result.Text, datePattern)
If dateMatch.Success Then
' Parse the matched date string into a DateTime object
Dim dateValue = DateTime.Parse(dateMatch.Value)
Console.WriteLine("Date: " & dateValue)
End If
Makbuzdan çıkarmanız gereken diğer bilgiler için benzer kalıplar oluşturabilirsiniz.
Çıkarılan Verileri Saklama ve Analiz Etme
Makbuzunuzdan ilgili bilgileri çıkardıktan sonra, bu bilgileri bir veritabanına kaydedebilir, analiz edebilir veya CSV, JSON veya Excel gibi diğer dosya formatlarına aktarabilirsiniz.
Sonuç
Sonuç olarak, IronOCR kullanarak Makbuz OCR, finansal verilerinizi dijitalleştirmek ve yönetmek için yenilikçi ve verimli bir çözümdür. IronOCR ile manuel veri girişini değiştirebilirsiniz. Bu adım adım kılavuzu izleyerek, IronOCR'un gücünden yararlanarak masraf takibinizi ve veri analizini geliştirebilirsiniz. En iyi yanı, IronOCR'un bir ücretsiz deneme sunmasıdır, bu sayede taahhütsüz olarak yeteneklerini deneyimleyebilirsiniz.
Deneme süresi sona erdikten sonra, IronOCR kullanmaya devam etmeye karar verirseniz, lisans $799 tarihinden başlar ve uygulamalarınızda OCR teknolojisinin avantajlarını uygun maliyetli bir şekilde kullanma imkanı sağlar.
Sıkça Sorulan Sorular
Bir fis görüntüsunu C# kullanarak dijital metne nasil dönüştürurum?
IronOCR'u kullanarak bir fis görüntüsunu dijital metne dönüştürebilirsiniz. IronTesseract sınıfini baslatarak, görüntüyu OcrInput ile yukleyip Read metodunu cagirarak metni çıkarin.
Optik Karakter Tanima nedir ve fisklar için nasil calisir?
Optik Karakter Tanima (OCR), görüntülerden veya taranmis belgelerden metni makineler tarafindan okunabilir verilere dönüştüren bir teknolojidir. Fisklar için, basili materyali tarar ve IronOCR kullanarak depolanip analiz edilebilecek metne cevirir.
Fis görüntüleri için OCR sonuc kalitesini nasil iyilestiririm?
OCR sonuclarini iyilestirmek, fis görüntülerinin yüksek kaliteli oldugundan emin olmak, deskewing ve denoising gibi görsel on işleme tekniklerini kullanmak, ve IronOCR'de doğru dil ayarlarini secmek ile saglanabilir.
Fis verisi çıkarmak için bir C# OCR kütüphanesi kullanmanin avantajlari nelerdir?
IronOCR gibi bir C# OCR kütüphanesi kullanmak, 125'ten fazla dili destekleme, yüksek doğruluk ve özellestirme seçenekleri sunarak fis verisi çıkarmayi iyilestirir, .NET projelerine kolayca entegre olmasini saglar.
Çıkarilan fis verisi raporlama ve analiz için nasil kullanilabilir?
Çıkarilan fis verisi veritabanlarina kaydedilebilir veya CSV, JSON, ya da Excel gibi formatlara ihrac edilebilir, bu da daha ileri işleme, raporlama ve analiz imkani saglar.
Bir .NET ortaminda bir OCR kütüphanesi kurulumu için prosedur nedir?
IronOCR'u bir .NET ortaminda kurmak için, Visual Studio'yu acin, 'NuGet Paketlerini Yönetin' bölümune gidin, 'IronOCR' aramasi yapin ve projenize yukleyin.
Fisler için OCR ciktilarindan belirli veriler nasil çıkarilir?
Fisler için OCR ciktilarindan belirli veriler, duzenli ifadeler veya string manipulasyonu kullanarak magaza adlari, satın alma tarihleri ve ürün fiyatlari gibi bilgileri analiz ederek çıkarilabilir.
Fis verisi OCR'da yaygin zorluklar nelerdir ve bunlar nasil halledilebilir?
Yaygin zorluklar, dusuk görüntü kalitesi ve karmaşik firin düzenleridir. Bu, görüntü kalitesini artırarak, ön işleme tekniklerini kullanarak ve IronOCR'deki özellestirme seçeneklerinden yararlanarak çözümlenebilir.
Fis OCR için IronOCR çok dilli desteği sagliyor mu?
Evet, IronOCR fis OCR için çok dilli desteği saglayarak, 125'ten fazla dilde metin tanimasi ve işlemesi saglayarak global uygulamalar için etkinligini arttirir.
C# OCR kütüphanesi için deneme sürümu mevcut mu ve lisanslama seçenekleri nelerdir?
IronOCR, kullanicilarin özelliklerini kesfetmesine olanak taniyan ücretsiz bir deneme sürümu sunar. Deneme sonrasinda, ekonomik bir lite sürümle baslayan çeşitli lisanslama seçenekleri mevcuttur.



