IronOCR ile AWS Textract OCR Arasında Karşılaştırma
OCR nedir?
Metin içeren bir görüntüyü makine tarafından okunabilir bir metin formatına dönüştürmek için kullanılan işleme Optik Karakter Tanıma (OCR) denir. Örneğin, bir form, fatura veya makbuz tararsanız, bilgisayarınız taramayı bir resim dosyası olarak kaydeder. Resim dosyasında bulunan veriler bir metin düzenleyici kullanılarak düzenlenemez, aranamaz veya sayılmaz. Ancak, resim dosyasını bir metin belgesine dönüştürmek için OCR çözümlerini kullanabilir ve içeriğini metin verisi olarak saklayabilirsiniz.
Bu modern çağda, çoğu iş akışı basılı medyadan bilgi almayı içerir. Farklı belgeler, kağıt formları, faturalar, taranmış yasal belgeler, tablo çıkarma ve basılı metinler veya sözleşmeler gibi öğeler, iş süreçlerinin bir parçasıdır. Ayrıca, bu tür dokümantasyon içeriğini dijitalleştirmek, içerisinde metin saklı olan görüntüler oluşturur. Görüntüdeki metinler, metin belgeleri gibi kelime işlem araçları tarafından işlenemez. OCR teknolojisi, metin görüntülerini diğer iş yazılımları tarafından analiz edilebilecek metin verilerine dönüştürerek bu sorunu çözer.
OCR Nasıl Çalışır?
OCR motoru, aşağıdaki adımları kullanarak çalışır:
Görüntü Edinme
Bu süreçte, bir tarayıcı belgeleri okuyarak bunları ikili veriye dönüştürür. OCR yazılımı, taranmış görüntüyü tanımlar ve açık alanları arka plan, koyu alanları ise metin olarak sınıflandırır.
Ön İşleme
OCR yazılımı, önce görüntüyü temizler ve hataları giderir, verilerini okumaya hazırlamak için düzenler.
Metin Tanıma
Metin tanıma için iki ana OCR algoritması türü desen eşleştirme ve özellik çıkarımıdır.
Desen Eşleştirme
Bir karakter resmi ya da glif, desen eşleştirme süreci boyunca izole edilir ve önceden kaydedilmiş bir glif ile karşılaştırılır.
Özellik Çıkartma
Özellik çıkarma süreciyle, glifler çizgiler, kapalı döngüler, çizgi yönü ve çizgi birleşim yerleri gibi özelliklere ayrılır.
Son İşleme
Teknoloji, analizden sonra elde edilen metin verilerini dijital bir dosyaya dönüştürür. Bazi OCR sistemleri, taranan belgenin hem onceki hem de sonraki surumlerini iceren anotlu PDF dokümanlari oluşturabilir.
Bu makale, OCR için en yaygın kullanılan iki uygulama ve doküman kütüphanesi arasındaki karşılaştırmayı ele alacaktır:
- IronOCR AWS OCR Textract
IronOCR Kutuphanesi
IronOCR, tarama, arama yapma, resim ve PDF okuma hizmetleri sunan bir C# .NET kütüphanesidir. 125'ten fazla küresel dil paketiyle birlikte gelir. Çıktı, metin, yapılandırılmış veri veya aranabilir PDF'ler olarak elde edilir. .NET surumlerini 6, 5, Core, Standard ve Framework gibi destekler.
IronOCR, kusursuz taranmamış resim ve belgelerden verileri otomatik olarak algılama ve çıkarma yeteneği ile benzersizdir. 'IronTesseract' Sınıfı en basit API'ye sahiptir. Herhangi bir platformda, hızı, doğruluğu artırılmış ve yerel bir DLL ve API ile bilinen en gelişmiş Tesseract derlemesini sağlar.
IronOCR, tüm resim formatlarından barkod ve QR kodlarını tarayabilir ve en son Tesseract 5 motorunu kullanarak metin okur ve PDF taraması yapar.
Özellikler
- Tamamen .NET uygulamaları için yapılmıştır. 125 farklı dili destekleyebilir. IronOCR tarafından Arapça, Çince, İngilizce, Fince, Fransızca, Almanca, Japonca ve birçok diğer dil desteklenmektedir. Eğimli bir görüntünün konumunu düzeltebilir ve net bir çıktı için görüntüden gürültüyü kaldırabilir. Düşük DPI'li düşük çözünürlüklü görüntülerde olağanüstü derecede iyi performans gösterir. Birden fazla türde QR kodlarını ve barkodları okuyabilir.
- Ayrica Gif ve Tiff formatlarini da destekler.
- Aynı anda birçok iş parçacığına izin verir. Bu, diğer OCR kütüphanelerinde bulunmayan olağanüstü bir özelliktir. Sureci daha duzgun hale getirir.
- OCR kullanarak PDF dosyalarında kolayca OCR işlemi yapabilir ve arama yapılabilir PDF belgeleri dışa aktarabilir.
Simdi AWS OCR'ye bir goz atalım.
AWS OCR Textract
Amazon'un AWS Textract'i, taranmış belgelerden otomatik olarak metin ve veri çıkartan bir makine öğrenmesi (ML) hizmetidir. Derin öğrenme teknolojisini kullanarak formlardan ve tablolardan veri tanımlamak, anlamak ve çıkarmak için basit optik karakter tanımanın (OCR) ötesine geçer.
AWS OCR Textract, herhangi bir belge türünü okumak ve işlemek için makine öğrenimini kullanarak, manuel çaba olmadan metin, tablo verileri ve diğer verileri doğru bir şekilde çıkarır. Verileri çıkarmak saatler veya günler yerine, Textract bunu hızlı bir şekilde yapabilir. Ayrıca, modellerinizi kontrol etmek ve hassas verileri denetlemek için Amazon Artırılmış Yapay Zeka (AI) ile insan değerlendirmeleri ekleyebilirsiniz.
Özellikler
Farklı belgelerde, finansal raporlar, tıbbi kayıtlar, tablolar ve vergi formları da dahil olmak üzere, metin tespit edin. Kapsamli Veri Analizi API'sini kullanarak belgelerden metin, form ve tablo verilerini yapılandırilmis veriyle cikarin.
- Analyze Document API içinde Queries özelliğini kullanarak belgelerden bilgi belirleyin ve çıkarın.
- Faturaları ve makbuzları Analyze Expense API ile işleyin.
- ABD tarafından verilmiş ehliyet ve pasaport gibi kimlik belgelerini işleyin. government, Analyze ID API kullanarak.
- Karar verme sürecini hızlandırabilecek ölçeklenebilir belge analizi.
Makaleye geri kalanında şöyle devam edilir:
- Visual Studio Projesi Oluşturma
- IronOCR'un Yüklenmesi
- AWS OCR Textract Kurulumu
- PDF'den Metne
- Görüntüyü Metne
- Barkod ve QR'ı Metne Dönüştürme
- Lisanslama
- Sonuç
1. Visual Studio Projesi Oluşturma
Bu öğretici Visual Studio 2022 sürümünü kullanacaktır, bu nedenle onu kurmuş olduğunuzu varsayıyorum.
- Visual Studio 2022'yi açın.
- Yeni bir .NET Core projesi oluşturun ve ardından Console App'i seçin.
Konsol Uygulaması
-
Projeye bir isim verin. Örneğin TextReader. En yeni ve en kararlı .NET Framework sürümü 6.0'dır. Bunu kullanacağız.

- Oluştur düğmesine tıklayın ve proje oluşturulacaktır.
Sonraki adımda, kullanacağımız kütüphaneleri birer birer kuracağız.
2. IronOCR'nin Kurulumu
IronOCR kutuphanesi dört şekilde indirilebilir ve kurulabilir. Bunlar aşağıdaki gibidir:
Visual Studio NuGet Paket Yöneticisini Kullanma.
- NuGet web sitesi üzerinden doğrudan indirme.
- IronOCR web sayfası üzerinden doğrudan indirme.
- Visual Studio'da Komut Satırını Kullanma.
2.1. Visual Studio NuGet Yöneticisini Kullanma
Visual Studio NuGet Paket Yöneticisi, bir C# projesine IronOCR'u entegre etmek için kullanılabilir.
- Araçları genişletin veya çözüm gezginine sağ tıklayın.
- NuGet Paket Yöneticisi'ni genişletin.
- Çözüm için NuGet Paketlerini Yönet'e veya çözüm gezgininde NuGet Paketlerini Yönet'e tıklayın.
NuGet Paketlerini Yonet
Bunun ardından arama çubuğunda yeni bir pencere görünecek: IronOCR yazın. Sağ taraftaki proje kutusunu kontrol edin ve Yükle'ye tıklayın.
IronOCR'yi gezin
Bu yöntemi kullanarak, geliştiriciler IronOCR kutuphanesini ve geliştiricinin tercih ettiği herhangi bir dil paketini yükleyebilir.
2.2. NuGet web sitesi üzerinden direkt indirme
IronOCR, aşağıdaki talimatları izleyerek NuGet web sitesinden doğrudan indirilebilir:
- "https://www.nuget.org/packages/IronOcr/" adresine gidin.
- Sağdaki menüden indirme paketi seçeneğini seçin.
- İndirme paketine çift tıklayın. Otomatik olarak yüklenecektir.
- Ardından, çözümü yeniden yükleyin ve projede kullanmaya başlayın.
2.3. IronOCR web sayfası aracılığıyla doğrudan indirme
Geliştiriciler, IronOCR kütüphanesini web sitesinden doğrudan bu Bağlantı kullanarak indirebilir.
- Çözüm penceresinden projeyi sağ tıklayın.
- Daha sonra, Referans seçeneğini seçin ve indirilen referansın yerini tarayın.
- Ardından, referansı eklemek için Tamam'a tıklayın.
2.4. Visual Studio'da Komut Satırı Kullanımı
- Visual Studio'da Araçlar -> NuGet Paket Yöneticisi -> Paket Yöneticisi Konsolu'na gidin.
- Paket yöneticisi konsolu sekmesine şu satırı girin:
Install-Package IronOcr
Paket şimdi mevcut projeye indirilecek/kurulacak ve kullanıma hazırdır.
Konsol Uygulaması
Konsol Uygulaması
Komutu girdikten sonra enter tuşuna basın ve kurulacaktır.
2.5. IronOCR Ad Alanı Ekleme
IronOCR kullanmak için programa bu kod satırını dahil edin:
using IronOcr;
using IronOcr;
Imports IronOcr
Şimdi AWS Textract'ı yükleyelim.
3. AWS Textract OCR'yi Yükleme
Amazon Textract'ı ilk kez kullanmadan önce, aşağıdaki görevleri tamamlayın:
- AWS hizmetlerine kaydolun.
- Bir IAM Kullanıcısı oluşturun.
Hesaba başarıyla kaydolduktan ve IAM kullanıcısını oluşturduktan sonra, API'ye programlı olarak erişmek için erişim anahtarlarını AWS konsolunda ayarlayabilirsiniz. Şunlara ihtiyaçınız olacak:
- AccessKeyId
- SecretAccessKey
- RegionEndPoint (Erişim alanınız)- Bu örnek durumda: AFSouth1
3.1. NuGet Paket Yöneticisi Kullanımı
- AWS Textract SDK'sını NuGet Paket Yöneticisi'nden indirebilir ve yükleyebilirsiniz.
NuGet Paket Yöneticisi
- Gezinta'ya tıklayın ve AWS Textract'ı arayın:
AWS Textract
3.2. AWS OCR Ad Alanları Ekleme
AWS Textract'ı kullanmak için aşağıdaki ad alanlarını dahil edin:
using Amazon.Textract;
using Amazon.Textract.Model;
using Amazon.Textract;
using Amazon.Textract.Model;
Imports Amazon.Textract
Imports Amazon.Textract.Model
4. PDF dosyasını Metne
Her iki kütüphane de PDF dosyalarından metin çıkartabilir. Koda teker teker bakalım.
4.1. IronOCR Kullanımı
IronOCR, gelişmiş Tesseract kullanarak PDF belge formatlarından metin tanıma ve okuma imkanı verir. Bilgi çıkartmak için kullanılan basit kod aşağıdadır:
var Ocr = new IronTesseract();
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// We can also select specific PDF page numbers to OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// Read every page of the PDF
}
var Ocr = new IronTesseract();
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// We can also select specific PDF page numbers to OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// Read every page of the PDF
}
Dim Ocr = New IronTesseract()
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' We can also select specific PDF page numbers to OCR
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' Read every page of the PDF
End Using
Kod basit, temiz ve çok kolay anlaşılır ve kullanılır.
Giriş PDF Dosyası
Örnek PDF
Çıktı
IronOCR Çıkışı
4.2. AWS Textract
Amazon Textract, uygulamalarınıza belge metni tespiti ve analizi eklemeyi kolaylaştırır. PDF okumak için aşağıdaki kod kullanılır ve aynı PDF iletilir:
public static async void ReturnResult()
{
AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
var request = new StartDocumentTextDetectionRequest();
request.DocumentLocation = new DocumentLocation
{
S3Object = new S3Object
{
Bucket = "your_bucket_name",
Name = "your_bucket_key"
}
};
var id = await client.StartDocumentTextDetectionAsync(request);
var jobId = id.JobId;
var response = client.GetDocumentTextDetectionAsync(new GetDocumentTextDetectionRequest{
JobId = jobId
});
response.Wait();
if (response.Result.JobStatus.Equals("SUCCEEDED"))
{
foreach (var block in response.Result.Blocks)
{
if (block.BlockType == "WORD" || block.BlockType == "PAGE" || block.BlockType == "LINE")
{
Console.WriteLine(block.Text);
}
}
}
}
static void Main(String[] args)
{
ReturnResult();
}
public static async void ReturnResult()
{
AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
var request = new StartDocumentTextDetectionRequest();
request.DocumentLocation = new DocumentLocation
{
S3Object = new S3Object
{
Bucket = "your_bucket_name",
Name = "your_bucket_key"
}
};
var id = await client.StartDocumentTextDetectionAsync(request);
var jobId = id.JobId;
var response = client.GetDocumentTextDetectionAsync(new GetDocumentTextDetectionRequest{
JobId = jobId
});
response.Wait();
if (response.Result.JobStatus.Equals("SUCCEEDED"))
{
foreach (var block in response.Result.Blocks)
{
if (block.BlockType == "WORD" || block.BlockType == "PAGE" || block.BlockType == "LINE")
{
Console.WriteLine(block.Text);
}
}
}
}
static void Main(String[] args)
{
ReturnResult();
}
Public Shared Async Sub ReturnResult()
Dim client As New AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1)
Dim request = New StartDocumentTextDetectionRequest()
request.DocumentLocation = New DocumentLocation With {
.S3Object = New S3Object With {
.Bucket = "your_bucket_name",
.Name = "your_bucket_key"
}
}
Dim id = Await client.StartDocumentTextDetectionAsync(request)
Dim jobId = id.JobId
Dim response = client.GetDocumentTextDetectionAsync(New GetDocumentTextDetectionRequest With {.JobId = jobId})
response.Wait()
If response.Result.JobStatus.Equals("SUCCEEDED") Then
For Each block In response.Result.Blocks
If block.BlockType = "WORD" OrElse block.BlockType = "PAGE" OrElse block.BlockType = "LINE" Then
Console.WriteLine(block.Text)
End If
Next block
End If
End Sub
Shared Sub Main(ByVal args() As String)
ReturnResult()
End Sub
Kod biraz zorludur, uzun ve nesneleri iletirken ve alırken özen gösterilmesi gerekir. Öncelikle, 3 parametre ile bir AmazonTextractClient nesnesi oluşturmamız gerekiyor: AccessKeyId, SecretAccessKey ve Region. Daha sonra StartDocumentTextDetectionRequest() metodunu kullanarak bir istek başlatmamız gerekiyor. İstek nesnesi daha sonra kovA adı ve anahtarı kullanılarak DocumentLocation ayarlıyor. Bu istek daha sonra StartDocumentTextDetectionAsync() metoduna iletiliyor. Bu bir asenkron metot olduğundan, await anahtar kelimesini kullanmamız ve ReturnResult fonksiyonunu asenkron yapmamız gerekiyor. Başarı durumunda, sonuç döndürülür ve jobId kaydedilir. jobId, GetDocumentTextDetectionAsync() metoduna iletilir ve SUCCEEDED yanıtını bekler. foreach döngüsü, her bloğu döngüye sokmak ve 'WORD', 'PAGE' veya 'LINE' olup olmadığını kontrol etmek için kullanılır, ardından metin tanıma çıktısını verir. Son olarak, belge işleme için bu metodu Main metodunda çağırın.
Çıktı
Çıktı IronOCR ile oldukça benzer.
AWS Textract Çıkışı
5. Resimlerden Metne
Resimlerden veri okuma zordur çünkü görüntü kalitesi bilgi çıkartırken hayati bir rol oynar. Her iki kütüphane de metin çıkartma olanağı sağlar. Burada png dosyalarını kullanacağız.
5.1. IronOCR Kullanımı
Kod bir önceki koda oldukça benzer. Burada, AddPDF metodu AddImage metodu ile değiştirilir.
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddImage("test-files/redacted-employmentapp.png");
//... you can add any number of images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddImage("test-files/redacted-employmentapp.png");
//... you can add any number of images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.AddImage("test-files/redacted-employmentapp.png")
'... you can add any number of images
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Giriş Görüntüsü
Karartılmış Çalışan Verileri
Çıktı
Çıktı temizdir ve orijinal görüntüye sadece birkaç satır kodla teknik olmadan ve mükemmel bir sonuçla uyum sağlar.
Görüntü Çıkışı
5.2. AWS Textract Kullanımı
Aşağıdaki kod, resimlerden metni tespit etmeye yardımcı olur:
public static async void ReturnResult()
{
AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
var request = new DetectDocumentTextRequest();
request.Document = new Document
{
Bytes = new MemoryStream(File.ReadAllBytes(@"test-files/redacted-employmentapp.png"))
};
var result = await client.DetectDocumentTextAsync(request);
foreach (var block in result.Blocks)
{
if (block.BlockType == "WORD")
{
Console.WriteLine(block.Text);
}
}
}
static void Main(String[] args)
{
ReturnResult();
}
public static async void ReturnResult()
{
AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
var request = new DetectDocumentTextRequest();
request.Document = new Document
{
Bytes = new MemoryStream(File.ReadAllBytes(@"test-files/redacted-employmentapp.png"))
};
var result = await client.DetectDocumentTextAsync(request);
foreach (var block in result.Blocks)
{
if (block.BlockType == "WORD")
{
Console.WriteLine(block.Text);
}
}
}
static void Main(String[] args)
{
ReturnResult();
}
Public Shared Async Sub ReturnResult()
Dim client As New AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1)
Dim request = New DetectDocumentTextRequest()
request.Document = New Document With {.Bytes = New MemoryStream(File.ReadAllBytes("test-files/redacted-employmentapp.png"))}
Dim result = Await client.DetectDocumentTextAsync(request)
For Each block In result.Blocks
If block.BlockType = "WORD" Then
Console.WriteLine(block.Text)
End If
Next block
End Sub
Shared Sub Main(ByVal args() As String)
ReturnResult()
End Sub
Yine, kod bir önceki koda oldukça benzer. Burada, DetectDocumentTextRequest() metodunu kullanarak bir istek başlatmamız gerekiyor. İstek nesnesi, tüm baytları okuyarak belgeyi ayarlar. Bu istek daha sonra DetectDocumentTextAsync() metoduna iletiliyor. Bu bir asenkron metot olduğundan, await anahtar kelimesini kullanmamız ve ReturnResult fonksiyonunu asenkron yapmamız gerekiyor. Başarı durumunda, sonuç bloklar halinde döndürülür. foreach döngüsü, her bloğu döngüye sokmak ve 'WORD' olup olmadığını kontrol etmek için kullanılır, ardından metin tanıma çıktısını verir. Son olarak, belge işleme için bu metodu Main metodunda çağırın.
Çıktı IronOCR'e benzer, ancak bu, dosyanın önceden AWS kovasına yüklenmesini gerektirir.
6. Barkod ve QR kodu Metne
IronOCR'un benzersiz bir özelliği, belgelerdeki metinleri tararken barkodları ve QR kodlarını okuyabilmesidir. OcrResult.OcrBarcode sınıfı örnekleri, geliştiriciye her taranan barkod hakkında ayrıntılı bilgi verir. AWS Textract bu işlevselliği sağlamaz.
IronOCR için kod aşağıda verilmiştir:
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("test-files/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// type and location properties also exposed
}
}
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("test-files/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// type and location properties also exposed
}
}
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("test-files/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' type and location properties also exposed
Next Barcode
End Using
Kod kendini anlatan bir yapıdadır ve kolay anlaşılır.
7. Lisanslama
IronOCR, geliştirici lisansını ücretsiz sunan bir kütüphanedir. Ayrıca farklı bir fiyatlandırma yapısına sahiptir; Lite paket, $799 ile başlar ve gizli ücret yoktur. SaaS ve OEM ürünlerinin dağıtımı da mümkündür. Tüm lisanslar 30 günlük para iade garantisi, bir yıllık yazılım desteği ve güncellemeler, dev/staging/production geçerliliği ve süresiz lisans (tek seferlik satın alma) ile birlikte gelir. IronOCR'un tüm fiyat yapısını ve lisanslama ayrıntılarını görmek için buraya gidin.
IronOCR Fiyat Planı
SaaS ve OEM ürünlerinin yeniden dağıtımını telifsiz bir şekilde tek seferlik satın alma ile elde edebilirsiniz $1,599.
SAAS Hizmeti
AWS Textract API, geliştiricilere AWS Ücretsiz Katman hizmeti sunar. Amazon Textract ile ücretsiz olarak başlayabilirsiniz. Ücretsiz Katman üç ay sürer ve fiyatlandırma aşağıda gösterilmiştir.

Fiyat Listesi
You can have a look at the pricing details from this link. Ayrıca, fiyatları ihtiyaçlarınıza göre ayarlamak için fiyatlandırma hesaplayıcısını kullanabilirsiniz.
8. Sonuç
IronOCR, C# geliştiricilerine her platformda bildiğimiz en gelişmiş Tesseract API'sini sağlar. IronOCR, Windows, Linux, Mac, Azure, AWS, Lambda'da dağıtılabilir ve .NET Framework projelerini desteklediği gibi .NET Standard ve .NET Core projelerini de destekler. Ayrıca taramaları OCR'de okuyabilir ve OCR'larımızı HTML ve aranabilir PDF'ler olarak dışa aktarabiliriz.
Amazon Textract, uygulamalarınıza belge metni tespiti ve analizi eklemeyi kolaylaştırır. Amazon Textract, Amazon'un bilgisayar görme bilimcileri tarafından geliştirilen ve günlük olarak milyarlarca görüntü ve videoyu analiz etmek için kullanılan kanıtlanmış, son derece ölçeklenebilir derin öğrenme teknolojisine dayanmaktadır. Kullanmak için herhangi bir makine öğrenimi uzmanlığına ihtiyaçınız yoktur. Amazon Textract, görüntü dosyalarını ve PDF dosyalarını analiz edebilen basit, kullanımı kolay API'ler içerir. Amazon Textract her zaman yeni verilerden öğreniyor ve Amazon bu hizmete sürekli yeni özellikler ekliyor.
IronOCR lisansları geliştirici bazlıdır, bu nedenle ürünü kullanacak geliştirici sayısına göre her zaman bir lisans satın almalısınız. AWS Textract lisansları, bilgileri çıkarmak ve verileri analiz etmek için belgedeki sayfa sayısına dayanır. Lisanslar aylık bazdadır ve fiyatlar IronOCR lisansına kıyasla çok sayıda sayfa için çok yükselebilir. Ayrıca, IronOCR lisansı tek seferlik bir satın almadır ve ömür boyu kullanılabilir ve OME ve SaaS dağıtımını destekler.
Genel karşılaştırmada, hem IronOCR hem de AWS OCR belgelerden veya görüntülerden metin tespit etme yeteneklerine sahiptir. IronOCR, AWS OCR'a göre hafif bir avantaja sahiptir çünkü hızlıdır ve zaman tasarrufu sağlar. Kod basittir ve belgelerden metin tespit ederken doğrudandır. Görev birkaç yöntemle gerçekleştirilir. Öte yandan, AWS Textract aynı görevi gerçekleştirmek için birçok yöntem kullanır. Bu da sunucu yanıtını artırır ve bazen zaman alıcıdır. IronOCR'ye mükemmel olmayan bir belge bile girsek, belgenin kötü formatlanmış, eğik ve dijital gürültü içerse de, içeriğini yaklaşık %99 istatistiksel doğrulukla tam olarak okuyabilir. Hız şaşırtıcı: IronOCR.2020+, önceki sürümlerden 10 kata kadar daha hızlıdır ve %250'den fazla daha az hata yapar.
Daha da ötesi, Iron Software şu anda iki araç fiyatına beş araçlık bir paket sunuyor. Iron Suite'te yer alan araçlar şunlardır:
- IronBarcode
- IronXL
- IronOCR
- IronPDF
- IronWebScraper
İRONSUITE'i keşfetmek için lütfen bu bağlantıyı ziyaret edin.
Sıkça Sorulan Sorular
Optik Karakter Tanıma (OCR) nedir?
Optik Karakter Tanıma (OCR), taranmış kağıt belgeler, PDF'ler veya dijital kamera tarafından çekilmiş görüntüler gibi farklı tipte belgeleri düzenlenebilir ve aranabilir verilere dönüştüren bir teknolojidir. IronOCR, bu süreci gelişmiş algoritmalar kullanarak geliştiren güçlü bir C# .NET kütüphanesidir.
C# kullanarak metin görüntülerini makineler tarafından okunabilir metne nasıl dönüştürebilirim?
IronOCR, metin görüntülerini makineler tarafından okunabilir metne dönüştürmek için kullanılan bir C# .NET kütüphanesidir. Gelişmiş OCR algoritmaları aracılığıyla görüntüleri işler ve tanınan metni kolayca programlanabilir formatlarda çıktı verir.
IronOCR, kusurlu taranmış görüntüleri nasıl ele alıyor?
IronOCR, kusurlu taranmış görüntüleri etkili bir şekilde yönetmek ve işlemek için tasarlanmıştır. Eğri düzeltme, metin kontrastını artırma ve OCR doğruluğunu artırmak için görüntü kalitesini iyileştirme ön işleme yetenekleri içerir.
IronOCR'u çok iş parçacıklı işlem için kullanabilir miyim?
Evet, IronOCR çok iş parçacığı desteği sunar, bu da aynı anda birden fazla belgenin işlenmesine izin verir, bu da belge ağırlıklı uygulamalarda performansı ve verimliliği önemli ölçüde artırır.
IronOCR, OCR görevleri için hangi dilleri destekler?
IronOCR, 125'ten fazla dili destekler, bu da onu birçok dilde belgelerin işlenmesi ve metne dönüştürülmesi gerektiği küresel uygulamalar için çok yönlü bir araç haline getirir.
IronOCR bir Visual Studio projesine nasıl kurulur?
IronOCR, NuGet Paket Yöneticisi aracılığıyla bir Visual Studio projesine kurulabilir. NuGet konsolunda 'IronOCR' aratarak kurabilir ve böylece .NET uygulamalarınıza OCR işlevselliğini entegre edebilirsiniz.
IronOCR için fiyatlandırma modeli nedir?
IronOCR, tek seferlik bir lisanslama modeli sunar. Geliştiriciler için esneklik ve huzur sunarak, 30 günlük para iade garantisi ile birlikte kalıcı lisanslar içerir.
AWS Textract, IronOCR'yi teknoloji açısından nasıl farklı kılıyor?
AWS Textract, belge içeriğinin ayrıntılı bir analizini sağlayarak, metni ve verileri çıkarmak için makine öğrenimi ve derin öğrenme teknolojilerini kullanır. Buna karşılık, IronOCR, kapsamlı dil desteğiyle .NET projeleri içinde kullanım kolaylığı ve entegrasyona odaklanan sağlam bir OCR çözümü sunar.
IronOCR barkod ve QR kodlarını okuyup işleyebilir mi?
Evet, IronOCR hem barkod hem QR kodlarını okuyup işleyebilir. Her bir kod hakkında ayrıntılı bilgi çıkarırken, aynı anda metin taraması yaparak, onu kapsamlı bir belge işleme aracı yapar.
IronOCR'u destekleyen platformlar ve ortamlar nelerdir?
IronOCR, Windows, Linux, Mac, Azure, AWS ve Lambda dahil geniş bir ortam yelpazesi ile uyumludur. .NET Framework, .NET Standard ve .NET Core projelerini destekler, farklı geliştirme ekosistemleri arasında esneklik sağlar.



