IronOCR ile Syncfusion OCR Arasında Bir Karşılaştırma
Bu makale, görüntülerden ve taranmis belgelerden basili metni algilamak ve cikarmak icin optik karakter tanıma (OCR) kullanan iki yazilim kutuphanesini karsilastiracak. Once her iki kutuphanenin özelliklerini tartisacagız. Sonrasında her iki kutuphane kullanılarak oluşturulmus örnek kaynak kodlarina bakinabilir ve bunların metin tanıma ve çıkartma yeteneklerini kıyaslarız. Son olarak, kutuphanelerin lisanslama ve fiyatlandırmasını kıyaslayacagız.
Bu makalede kıyaslayacağımız kütüphaneler şunlardır:
- IronOCR
- Syncfusion Essential PDF
1. Syncfusion OCR
Syncfusion'un Essential PDF kutuphanesi, PDF belgelerindeki taranmış görüntüler üzerinde görüntü-metin işleme işlevselliğini etkinleştirmek için OCR işlevselliğini entegre eder.
Syncfusion'un OCR işlemcisi, Tesseract sürümleri 3 (3.02 ve 3.05) ve 4 ile çalışabilir. Kütüphane, .NET Core ve ASP.NET uygulamalarına dahil edilebilir.
SyncFusion Essential PDF'nin OCR İşlevselliğinin Özellikleri:
- PDF Belgelerinde OCR Görevlerini Yürütün. Kütüphanenin
OCRProcessorsınıfı, PDF dosyaları üzerinde OCR gerçekleştirmek için kullanılabilir. Dünyanın en iyi OCR işlemcilerinden biri olarak bilinen Tesseract veri işlemcisine dayanmaktadır. - PDF Belgelerinin Bölümleri Üzerinde OCR Görevleri Gerçekleştirin. Kullanıcılar, PDF belgesinin belirli sayfalarının veya alanlarının OCR'ını yapabilir.
- Görüntüler Üzerinde OCR Görevleri Gerçekleştirin. Kullanıcılar, diğer uygulamalara aktarmak üzere görüntülerden metin verilerini çıkarabilir.
- Çoklu Dil Desteği. Google Tesseract motoru (bu anlamda Syncfusion), şu anda 60'tan fazla dili desteklemektedir ve birçok dil üzerinde deneyler yapmaktadır.
- İyi Doğruluk. Google'ın Tesseract açık kaynak motorunu kullanarak, Syncfusion Essential PDF çok iyi metin doğruluğu sağlar ve makul bir sürede OCR gerçekleştirir.
2. IronOCR
IronOCR, .NET platformu geliştiricilerinin resimlerden ve PDF belgelerinden metni tanımasına ve okumasına olanak tanıyan bir C# yazılım kütüphanesidir. Yalnızca .NET için olan bu OCR kütüphanesi, güçlü Tesseract motorunu kullanır. Tesseract sürümleri 3 - 5, Windows, macOS, Linux, Azure, AWS, Lambda, Mono ve Xamarin Mac üzerinde kutudan çıktığı gibi çalışır.
IronOCR diğer tüm OCR motorlarından daha fazla dili kapsar, toplamda 125 dili destekler (yalnızca İngilizce varsayılan olarak yüklüdür).
.NET geliştiricileri, belgeleri üzerinde tam kontrol sahibidir ve gerektiğinde belgeleri uygun şekilde değiştirebilirler.
2.1. IronOCR Özellikleri
IronOCR, kullanıcı teknik geçmişi veya donanım karmaşıklığından bağımsız olarak, fotoğraflardan detay çıkarma, imzalama ve dışa aktarma gibi yetenek ve işlevlerin benzersiz bir birleşimini sunar.
2.1.1. Doğruluk
IronOCR SDK, doğruluk açısından diğer OCR kütüphanelerini geçer, %99,8 doğruluk oranına sahiptir.
2.1.2. Düşük Kaliteli Tarama ve Görüntüleri Düzeltme
IronOCR sınıfı, C# geliştiricilerine geniş kapsamlı kontrol sağlar. Geliştiricilere OCR (görüntüler ve PDF'den metne) işlevselliği ve her bir belirli durumda ince ayarlanmış performans sunar.
IronOCR, ideal olmayan kalitede görüntüleri işlemek için kütüphaneye yapılandırma seçenekleri içerir. Bu yapılandırmalardan bazıları şunlardır: Arka Plan Gürültüsünü Temizleme, Kontrast Artırma, Çözünürlük Artırma, Dil, Strateji, Döndürme ve Düzeltme, Renk Uzayı, Karanlık Arka Planlarda Beyaz Metni Algılama ve Girdi Görüntü Tipi.
2.1.3. Diller
IronOCR, 125'ten fazla uluslararası dili destekler.
2.1.4. OCR Metin Çıkarma
Iron Tesseract, çeşitli resim formatlarını ve PDF dosyalarını okuyabilir. Bu özellik, standart ücretsiz Tesseract motorlarında mevcut değildir. Taramalarınız düşük kalitedeyse, OCR girişi gerekli özellikleri otomatik olarak düzeltmenizi sağlar.
2.1.5. Görüntü Optimizasyon Filtreleri
OCRInput sınıfı, C# programcılarına giriş üzerinde ince ayarlı kontrol sağlar. Görüntü girdisi, sonrasında geliştiriciler tarafından hız ve doğruluk için önceden işlenir. Bu, OCR işlemeden önce Photoshop Batch Scripts veya ImageMagick kullanma gereğini ortadan kaldırır.
2.1.6. Bir Görüntünün OCR Bölgesi
IronOCR, nihai kullanıcılarına, bir görüntünün belirli alanlarında OCR yapmalarına izin verir.
2.1.7. OCRResult Sınıfı
IronOCR, Tesseract 3, 4 veya 5 kullanarak taradığı her sayfa için ileri seviye bir sonuç nesnesi döndürür. Bu nesne, konum verileri, görüntüler, metin, istatistiksel güven, alternatif sembol seçenekleri, yazı tipi adları, yazı tipi boyutları, süslemeler, yazı tipi ağırlıkları ve aşağıdakilerin her biri için konum içerir:
- Sayfalar
- Paragraflar
- Metin Satırları
- Kelimeler
- Bireysel Karakterler
- Barkodlar
2.1.8. Tek Bir Belgede Birden Fazla Dil
IronOCR, geliştiricilere tek bir belgede birden fazla dil kullanma olanağı sağlar. Bu yetenek, .NET servis sağlayıcıları için son derece faydalıdır.
3. Visual Studio'da Yeni Bir Projeye Başlamak
Bu makalede, hem IronOCR hem de Syncfusion Essential PDF'nin OCR işleme yeteneklerini göstermek için yeni bir Visual Studio Konsol Uygulaması kullanacağız.
Visual Studio yazılımını açın, dosya menüsüne gidin ve Yeni Proje yi seçin. Ardından, Konsol Uygulamasını seçin.
Proje adını girin ve uygun metin kutusundaki yolu seçin. Sonra, oluştur düğmesini tıklayın ve ardından aşağıdaki ekran görüntüsünde olduğu gibi gerekli .NET çerçevesini seçin:
Visual Studio projesi, yeni konsol uygulaması için yapı oluşturacaktır. program.cs dosyası tamamlandıktan sonra açılacaktır.
Şimdi projeye her iki kütüphaneyi de ekleyeceğiz.
4. IronOCR Kütüphanesini Yükleme
IronOCR kutuphanesi dört şekilde indirilebilir ve kurulabilir. Bunlar su sekildedir:
- Visual Studio NuGet Paket Yöneticisini Kullanma
- NuGet web sayfasından doğrudan indirme.
- IronOCR web sayfasından doğrudan indirme.
- Visual Studio Komut Satırını Kullanma.
4.1. Visual Studio NuGet Yöneticisini Kullanma
IronOCR'u Visual Studio NuGet Paket Yöneticisi'ni kullanarak bir C# projesine entegre edebilirsiniz.
NuGet Paket Yöneticisi GUI'sine, Araçlar > NuGet Paket Yöneticisi > Çözümler için NuGet Paketlerini Yönet... üzerine tıklayarak erişin.
Bundan sonra yeni bir pencere açılacaktır. IronOCR'u arayın ve projeye paketi yükleyin.
IronOCR için ek dil paketleri de yukarıda belirtilen aynı yöntemle yüklenebilir.
4.2. NuGet Web Sayfasından Doğrudan İndirme
IronOCR, aşağıdaki talimatları izleyerek NuGet web sitesinden doğrudan indirilebilir:
- Navigate to the IronPDF NuGet Gallery Page.
- Sağdaki menüden indirme paketi seçeneğini seçin.
- İndirilen paketi çift tıklayın. Otomatik olarak yüklenecektir.
4.3. IronOCR Web Sayfasından Doğrudan İndirme
Geliştiriciler, IronOCR web sitesinden kütüphaneyi indirip bir proje referansı olarak ekleyebilirler.
Visual Studio'da kütüphaneyi referans olarak eklemek için aşağıdaki talimatları izleyin.
- Çözüm penceresinden projeyi sağ tıklayın.
- Ardından Proje Referansı Ekle'yi seçin ve indirilen referansın konumunu tarayın.
- Ardından, referansı eklemek için Tamam'a tıklayın.
4.4. Visual Studio Komut Satırını Kullanarak
- Visual Studio'da Araçlar > NuGet Paket Yöneticisi > Paket Yöneticisi Konsolu bölümüne gidin.
- Paket yöneticisi konsolu sekmesine şu satırı girin:
Install-Package IronOcr
Paket şimdi mevcut projeye indirilecek/yüklenecek ve kullanıma hazır olacak.
5. Syncfusion Essential PDF OCR Kütüphanesini Yükleme
Syncfusion Essential PDF, üç farklı şekilde yüklenebilir.
- Visual Studio NuGet Paket Yöneticisini Kullanma
- NuGet web sayfasından doğrudan indirme.
- Visual Studio Komut Satırını Kullanma.
5.1. Visual Studio NuGet Yöneticisi'ni Kullanarak
IronOCR ile benzer şekilde, geliştiriciler SyncFusion'un OCR Kütüphanesini de Visual Studio'nun NuGet Paket Yöneticisini kullanarak yükleyebilir.
Paket Yöneticisine daha önceki gibi, Araçlar > NuGet Paket Yöneticisi > Çözümler için NuGet Paketlerini Yönet... üzerine tıklayarak erişin.
SyncFusion OCR için arama yapın ve uygun paketi yükleyin (olması gereken Syncfusion.PDF.OCR.Net.Core).
Additional language packs for SyncFusion Essential PDF OCR can be downloaded from GitHub.
5.2. NuGet Web Sayfasından Doğrudan İndirme
Syncfusion Essential PDF OCR, bu talimatları izleyerek doğrudan NuGet web sitesinden indirilebilir:
- Navigate to the package's NuGet Gallery page.
- Sağdaki menüden indirme paketi seçeneğini seçin.
- İndirilen paketi çift tıklayın. Otomatik olarak yüklenecektir.
- Ardından, çözümü yeniden yükleyin ve projede kullanmaya başlayın.
5.3. Visual Studio Komut Satırını Kullanma
- Visual Studio'da Araçlar > NuGet Paket Yöneticisi > Paket Yöneticisi Konsolu bölümüne gidin.
- Paket yöneticisi konsolu sekmesine şu satırı girin:
Install-Package Syncfusion.PDF.OCR.Net.Core -Version 20.2.0.38
Paket şimdi mevcut projeye indirilecek/yüklenecek ve kullanıma hazır olacak.
6. PDF Belgesi Üzerinde OCR Gerçekleştirme
Hem IronOCR hem de Syncfusion OCR, PDF belgeleri üzerinde OCR gerçekleştirebilir. Burada, her ikisinin de Visual Studio'da nasıl kullanılabileceğini tartışacağız.
6.1. IronOCR Kullanarak PDF OCR Metin Çıkarma
Geliştiriciler birkaç satır kodla, bir bütün PDF üzerinde veya bir PDF'nin belirli sayfaları/bölümlerinde OCR gerçekleştirebilirler. Aşağıdaki kod kesitini düşünün.
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add a PDF document and specify a password if needed
Input.AddPdf("example.pdf", "password");
// Read the textual content from the PDF
var Result = Ocr.Read(Input);
// Display the text in the console
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add a PDF document and specify a password if needed
Input.AddPdf("example.pdf", "password");
// Read the textual content from the PDF
var Result = Ocr.Read(Input);
// Display the text in the console
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
' Add a PDF document and specify a password if needed
Input.AddPdf("example.pdf", "password")
' Read the textual content from the PDF
Dim Result = Ocr.Read(Input)
' Display the text in the console
Console.WriteLine(Result.Text)
End Using
6.2. Syncfusion Essential PDF OCR Kullanarak PDF OCR Metin Çıkarma
OCR işlemlerini hem PDF belgelerinde hem de belge bölgelerinde gerçekleştirmek için OCRProcessor sınıfını kullanabilirsiniz. Bağlam için aşağıdaki kod örneğini inceleyin.
using Syncfusion.OCRProcessor;
using Syncfusion.Pdf.Parsing;
// Initialize the OCR processor
using (OCRProcessor processor = new OCRProcessor(@"TesseractBinaries\"))
{
// Load the input PDF document
PdfLoadedDocument lDoc = new PdfLoadedDocument("Input.pdf");
// Set the OCR language
processor.Settings.Language = Languages.English;
// Perform OCR on the loaded PDF
processor.PerformOCR(lDoc, @"TessData\");
// Save the processed PDF
lDoc.Save("Sample.pdf");
// Close the document
lDoc.Close(true);
}
using Syncfusion.OCRProcessor;
using Syncfusion.Pdf.Parsing;
// Initialize the OCR processor
using (OCRProcessor processor = new OCRProcessor(@"TesseractBinaries\"))
{
// Load the input PDF document
PdfLoadedDocument lDoc = new PdfLoadedDocument("Input.pdf");
// Set the OCR language
processor.Settings.Language = Languages.English;
// Perform OCR on the loaded PDF
processor.PerformOCR(lDoc, @"TessData\");
// Save the processed PDF
lDoc.Save("Sample.pdf");
// Close the document
lDoc.Close(true);
}
Imports Syncfusion.OCRProcessor
Imports Syncfusion.Pdf.Parsing
' Initialize the OCR processor
Using processor As New OCRProcessor("TesseractBinaries\")
' Load the input PDF document
Dim lDoc As New PdfLoadedDocument("Input.pdf")
' Set the OCR language
processor.Settings.Language = Languages.English
' Perform OCR on the loaded PDF
processor.PerformOCR(lDoc, "TessData\")
' Save the processed PDF
lDoc.Save("Sample.pdf")
' Close the document
lDoc.Close(True)
End Using
7. Görüntüler Üzerinde OCR Gerçekleştirme
Her iki kütüphane de C#.NET ve .NET Core uygulamalarında görüntüler üzerinde OCR gerçekleştirebilir.
7.1. IronOCR Kullanarak Görüntüler Üzerinde OCR Gerçekleştirin
IronOCR, yalnızca iki satır kodla kusursuz taranmayan görüntülerden otomatik olarak metin algılama ve okuma yeteneğiyle benzersizdir.
using IronOcr;
// Perform OCR and read text from the specified image
var Result = new IronTesseract().Read(@"images\11111.png").Text;
using IronOcr;
// Perform OCR and read text from the specified image
var Result = new IronTesseract().Read(@"images\11111.png").Text;
Imports IronOcr
' Perform OCR and read text from the specified image
Private Result = (New IronTesseract()).Read("images\11111.png").Text
OCR Giriş Görüntüsü
OCR OUTPUT from IMAGE
OCR Output
Simple Data Outputs:
» NET Text Strings
» Barcode & QR Data & Images
Structured Data Outputs:
» Pages
» Blocks
» Paragraphs
» Lines
» Words
» Characters
Export Documents:
» Searchable PDFs
» hOCR / HTML Export
» Images of any Page, Text Element or Barcode
7.2. Syncfusion Essential PDF OCR İşlemcisi Kullanarak Görüntü Üzerinde OCR Gerçekleştirme
Syncfusion Essential PDF, görüntülerden büyük doğrulukla metin çıkarma yetisine sahiptir.
using System.Drawing;
using Syncfusion.OCRProcessor;
// Initialize the OCR processor
using (OCRProcessor processor = new OCRProcessor(@"TesseractBinaries\"))
{
// Load the input image
Bitmap image = new Bitmap("11111.jpeg");
// Set the OCR language
processor.Settings.Language = Languages.English;
// Perform OCR on the loaded image
string ocrText = processor.PerformOCR(image, @"TessData\");
}
using System.Drawing;
using Syncfusion.OCRProcessor;
// Initialize the OCR processor
using (OCRProcessor processor = new OCRProcessor(@"TesseractBinaries\"))
{
// Load the input image
Bitmap image = new Bitmap("11111.jpeg");
// Set the OCR language
processor.Settings.Language = Languages.English;
// Perform OCR on the loaded image
string ocrText = processor.PerformOCR(image, @"TessData\");
}
Imports System.Drawing
Imports Syncfusion.OCRProcessor
' Initialize the OCR processor
Using processor As New OCRProcessor("TesseractBinaries\")
' Load the input image
Dim image As New Bitmap("11111.jpeg")
' Set the OCR language
processor.Settings.Language = Languages.English
' Perform OCR on the loaded image
Dim ocrText As String = processor.PerformOCR(image, "TessData\")
End Using
OCR Giriş Görüntüsü
OCR OUTPUT from IMAGE
OCR Output
Simple Data Output:
+ NET Text Strings
Dee eT Nd
tC eke ass
Biren)
Soy
Seg
ors
eae
eed
TLC
eres
Smt d
See amr'
etd ieot
8. Lisanslama
Hem IronOCR hem de Syncfusion Essential PDF'nin kullanımı yazılım lisansları gerektirir.
8.1. IronOCR Lisanslama
IronOCR, kişisel, ticari olmayan projeler için ücretsiz bir geliştirme lisansına sahiptir.
IronOCR, ticari lisanslar için farklı bir fiyat yapısı sunar. Lite paket $799 ile başlar ve ek maliyet yoktur. Tüm lisanslar 30 günlük para iade garantisi, bir yıl yazılım desteği ve güncellemeleri, geliştirme, test, geçiş ve üretim geçerliliği ve süresiz lisans (tek seferlik satın alma) içerir. IronOCR'un tam fiyat yapısı ve lisanslama bilgileri hakkında bu sayfadan daha fazla bilgi edinin.
SaaS ve OEM ürünlerinin telif ücretsiz yeniden dağıtımı için $1,599 bir abonelik ücreti karşılığında edinebilirsiniz.
8.2. Syncfusion Essential PDF Lisanslama
Syncfusion Essential PDF, üç tür geliştirme lisansı sağlar, ancak SaaS ve OEM kapsama alanı sağlamaz.
- Topluluk Lisansı. Topluluk lisansı, 5'e kadar geliştiriciye sahip küçük şirketler ve geliştiriciler için ücretsizdir. Ayrıca canlı destek içerir.
- Perakende Lisansı. Perakende lisansı, bir kuruluşun her geliştiricisi için ayrı ayrı satın alınması gereken, yıllık bir lisanstır. Perakende lisansları yıl başına geliştirici başına $995 ile başlamaktadır.
- Sınırsız Lisans. Bu seçenek, aynı yıllık temelde ancak daha düşük fiyatla, bir kuruluşun tamamı için lisans sağlar.
View the entire licensing structure for Syncfusion Essential PDF (and for other Syncfusion components) on the product licensing page.
9. Sonuç
IronOCR toplamda yaklaşık 125 dünya dilini destekler. İşleme yetenekleri şunları içerir: Bir PDF belgesinin veya görüntünün bölümlerinde OCR yapabilme, PDF'lerden ve fotoğraflardan metin çıkarabilme ve daha pek çok özellik arasında düşük kaliteli bir görüntüyü düzeltebilme. IronOCR hız ve doğruluğu önceliklendirir. Yüzde 99,8 doğruluk oranı, piyasadaki diğer Tesseract tabanlı OCR kütüphanelerinden daha yüksektir. IronOCR, performans ayarlaması veya görüntü ön işleme gerektirmeden doğrudan kullanılabilir.
Syncfusion Essential PDF OCR, Google açık kaynak Tesseract motorunu da kullanır. Tüm belgelere veya belgelerin belirli bölümlerine OCR uygulayabilir. Syncfusion'un OCR kütüphanesi 60'tan fazla uluslararası dili destekler.
IronOCR lisansları, sınırsız destek ve SaaS ve OEM kapsamında ömür boyu geçerlidir. Öte yandan, Syncfusion Essential PDF OCR yıllık bazda lisanslar sunar. IronOCR fiyatlandırması $799 ile başlar ve Syncfusion fiyatlandırması yılda $995'dan başlar.
IronOCR'yı diğer dört Iron Software ürünü ile birlikte tam Iron Suite'i satın alarak indirimli bir fiyata edinin. Iron Suite içinde yer alan ürünler şunlardır:
- IronPDF
- IronOCR
- IronXL
- IronBarcode
- IronWebscraper
Iron Software lisanslama sayfası, yukarıdaki beş ürün için fiyatlandırma ve lisanslama hakkında daha fazla bilgi içerir.
Sıkça Sorulan Sorular
C# kullanarak görüntüler üzerinde nasıl OCR yapabilirim?
IronOCR'yi kullanarak C# üzerinde görüntülerde OCR yapabilirsiniz. Farklı görüntü formatlarından metin çıkarma yöntemleri sağlar, yüksek doğruluk sunar ve 125'ten fazla dili destekler.
IronOCR'un OCR görevleri için kullanmanın avantajları nelerdir?
IronOCR, belirli belge bölgelerinde OCR desteği, düşük kaliteli taramalar için görüntü optimizasyon özellikleri ve geniş bir dil yelpazesine sahip, %99.8 mükemmel doğruluk oranı sunar.
IronOCR, Syncfusion'un OCR yetenekleriyle nasıl karşılaştırılır?
Her ikisi de Tesseract motorunu kullanırken, IronOCR daha fazla sürüm (3-5) ve dil (125+) desteği sunar, daha iyi doğruluk sağlar ve Syncfusion'un OCR'sine kıyasla gelişmiş görüntü düzeltme yetenekleri sunar.
IronOCR için hangi lisanslama seçenekleri mevcuttur?
IronOCR, kişisel kullanım için ücretsiz bir geliştirme lisansı sunar, ticari lisanslar ise süresiz bir lisans ve SaaS/OEM kapsamı dahil olmak üzere 1599 dolardan başlamaktadır.
IronOCR, taranmış PDF belgelerinden metni çıkarabilir miyim?
Evet, IronOCR, Tesseract tabanlı OCR yeteneklerini kullanarak taranmış PDF belgelerinden metin çıkarabilir, yüksek doğruluk ve dil desteği sağlar.
IronOCR tarafından desteklenen platformlar nelerdir?
IronOCR, Windows, macOS, Linux, Azure, AWS, Lambda, Mono ve Xamarin Mac dahil olmak üzere birden fazla platformu destekler.
IronOCR, düşük kaliteli görüntü taramalarını nasıl işler?
IronOCR, arka plan gürültü temizliği, kontrast artırma ve çözünürlük ayarlaması gibi özelliklerle görüntü kalitesini artırır, bu da düşük kaliteli görüntülerdeki OCR sonuçlarını iyileştirir.
IronOCR ile bir belgenin belirli alanlarında OCR yapabilir miyim?
Evet, IronOCR, kullanıcıların belirli alanları veya belgelerin sayfalarını OCR için belirlemesine olanak tanır, metin çıkarma süreci üzerinde esneklik ve kontrol sağlar.
IronOCR'yi bir .NET projesine nasıl entegre edebilirim?
IronOCR, Visual Studio NuGet Paket Yöneticisi aracılığıyla, NuGet web sitesinden veya IronOCR web sitesinden indirerek bir .NET projesine entegre edilebilir.



