IronOCR ile Leadtools OCR Arasında Bir Karşılaştırma
OCR hakkında bilgi arıyorsanız, doğru yerdesiniz. Bu blog, OCR ve ilgili yazılımlardan bahsedecek ve bunların OCR ile ilgili görevlerde nasıl performans gösterdiğini inceleyecek. Soru ile başlayalım: OCR nedir?
Optik karakter tanıma (OCR), yazılı veya basılı metni tanımlamak ve dijital olarak kodlamak için optik tarayıcı ve özel yazılım kullanır. Bir bilgisayar, statik metin fotoğraflarını okuyabilir ve OCR yazılımı kullanarak bunları düzenlenebilir, aranabilir verilere dönüştürebilir.
OCR genellikle üç adımdan oluşur: OCR yazılımında belgeyi açma ve tarama, OCR yazılımında belgeyi tanıma ve OCR ile üretilen belgeyi seçtiğiniz formatta saklama.
Bugün, iki OCR yazılım paketinden bahsedeceğiz ve bunların artılarını ve eksilerini, ayrıca C#'da SDK entegrasyonu ve dışa aktarma yollarını karşılaştıracağız. Ele alınan yazılım paketleri şunlardır:
- LeadTools OCR
- IronOCR
1. LeadTools OCR
LEADTOOLS OCR, LEAD Technologies Inc. tarafından geliştirilen ve yayınlanan ödüllü geliştirme araçları serisinden gelir. LEADTOOLS, masaüstü, sunucu, tablet ve mobil uygulamalara raster, belge, tıbbi, multimedya ve vektör görseller entegrasyonu için kapsamlı araç koleksiyonudur. Dosya formatları (150+), görüntü sıkıştırma, görüntü işleme, renk dönüşümü, renk işleme, görüntü gösterimi, özel efektler, tarama/yakalama, yaygın diyaloglar, baskı, DICOM, PACS, OCR, barkodlar, form tanıma, PDF, belge temizliği, açıklamalar ve daha fazlası LEADTOOLS tarafından desteklenmektedir. Milyonlarca kod satırları, LEADTOOLS kiti kullanan uygulama geliştiricilerin neredeyse parmak uçlarında. LEADTOOLS, programlama ihtiyaçlarınız ne olursa olsun, size mevcut en güçlü görüntü teknolojisini sağlamak amacıyla tasarlanmış bir araç setidir.
LEADTOOLS, tanıma, belge, tıbbi, görüntüleme ve multimedya teknolojisini masaüstü, sunucu, tablet ve mobil sistemlere entegre etmek için kapsamlı bir araç seti olup, özel yapay zeka ve makine öğrenme algoritmaları ile desteklenmiştir. Uygulamalarınızı geliştirmek için neden 30 yılı aşkın görüntü geliştirme bilgisinden ve 150+ dosya türü desteğinden faydalanmayasınız.
LEADTOOLS OCR sınıf kütüphanesi, belge optik karakter tanıma (OCR) teknolojisinin yazılım programlarına hızlı ve verimli bir şekilde entegrasyonu için programlama yazılımı sağlar. Yazılımcılar, LEADTOOLS OCR Sınıf Kütüphanesi'ni kullanarak belge resimleri üzerinde karakter tanıma yapabilir ve tanınan metni 20'den fazla dosya formatına çıkış yapabilir.
1.1. LeadTools OCR Özellikleri
Lead araç seti, son kullanıcılar ve geliştiriciler için ödüllü bir multimedya teknolojileri dizisi sunar ve müşteri yelpazesini memnun edecek tüm OCR işlevlerini gerçekleştirebilir.
1.1.1. Çoklu İleti
Lead teknoloji motoru, son kullanıcıya çoklu ileti ve sunucu tabanlı OCR işlemleri için destek sağlar.
1.1.2. Birden Fazla OCR Belgesi
LeadTools Belge SDK'sı, kullanıcıların uygulamalarında birden fazla OCR belgesi oluşturmalarına olanak tanır. Her belge kendi sayfa listesini içerir.
1.1.3. Diller
Ödüllü LeadTools teknoloji dizisi, 40'tan fazla farklı dilde hizmet verir ve OCR sayfalarını tanırken hangi dili kullanmak istediğinizi seçmenize olanak tanır.
1.1.4. Sözlükler
LeadTools OCR, son kullanıcısının desteklenen tüm dillerin sözlüğüne erişmesine olanak tanıyan harika bir tarayıcı uygulamasıdır. Ayrıca, kullanıcılar tek bir belgede birden fazla sözlüğe erişebilir.
1.1.5. Belge Yönetim Sistemi
Fakslar, fotokopiler ve karmaşık düzenli belgeler dahil çeşitli belgeleri tanıyın.
1.1.6. Karakter Tanıma
Gelişmiş doğruluk ve hız sayesinde, LEADTOOLS OCR Uygulaması, resimler üzerinde optik karakter tanıma (OCR) yapabilir, fotoğraflardan metin çıkarabilir ve görüntüleri birden fazla belge formatına dönüştürebilir. Bir resimden metin değiştirmek ve paylaşmak için, OCR kullanarak metni çıkarın ve ardından kopyalayın.
1.1.7. Yapay Zeka
Lead Teknolojileri, aynı türden belgelerde tanımayı iyileştirmek için AI kullanır - bu, son kullanıcı için harika bir haber.
1.1.8. Bölge Tanıma
Ödüllü OCR araç kiti dizisinden Leadtools Belge SDK'sı, onu tamamen yeni bir bölge tanıma seviyesine taşıyan güçlü bölge tanıma yazılımı kullanır.
- Belge sayfaları bölgeleriyle veya bölgeleri olmadan gösterilebilir.
- Bölgeler dosyalardan içeri aktarılabilir ve dosyalara dışa aktarılabilir.
- Bir sayfayı tek bir bölge olarak tanıyın.
- Her bir sayfada manuel olarak birkaç bölge belirtin ve tanımlayın.
- Çok katmanlı bölgeler oluştururken ve tablolar, cetveller, fotoğraflar ve metinler gibi bölgeleri tanımlarken otomatik alan bölümlendirme kullanın.
- Her bölge için OMR, MRZ ve MICR bölgeleri gibi çeşitli, özel seçenekler sunun.
1.1.9. Bulut Hizmetleri
Bu, yüksek kapasiteli, ölçeklenebilir bir Web API'sidir. Kullanıcı dostu arayüzü, güçlü OCR, barkodlar, MICR ve belge dönüşümünü herhangi bir programa kolayca entegre etmenize olanak tanır.
Not:
NuGet'in resmi sitesi, .NET geliştiricilerinin LeadTools üzerine IronOCR'u ne kadar çok tercih ettiğini gösteriyor. LeadTools'un 77,8 K indirmesi var, ancak diğer yandan IronOCR'un 320 K'dan fazla indirmesi var.
2. IronOCR
IronOCR, .NET platformu programcıları için resimlerden ve PDF belgelerden metin tespit edip okumayı sağlamayı mümkün kılan bir C# yazılım kütüphanesidir. Bu, dünyanın en güçlü Tesseract motorunu kullanan saf bir .NET OCR paketidir. IronOCR, gerçek dünya grafikleri ve kusurlu belgelerle çalışırken, dijital gürültü veya hataları içeren düşük çözünürlüklü işlemler gibi durumlarda başarılıdır. Tesseract 5 (ve ayrıca 4 ve 3), Windows, macOS, Linux, Azure, AWS, Lambda, Mono ve Xamarin Mac üzerinde kutudan çıktığı gibi çalışır, çok az ya da hiç kurulum gerektirmez. Yerel ikili dosyaları ile uğraşmanıza gerek yok. Framework ve Core uyumludur.
IronOCR, herhangi bir OCR motoru ile olduğundan daha fazla dili destekler, bu sayede programcıların anlamlı görüntü oluşturumları yapmalarına ve multimedya verilerini bunlardan çıkarmalarına olanak tanır. IronOCR, 125 uluslararası dili destekler, ancak IronOCR'da varsayılan olarak yalnızca İngilizce yüklenmiştir.
IronOCR araç kiti tarafından sağlanan hizmet entegre edilmesi kolay, işlenmesi kolay ve diğer OCR motorlarından daha etkileşimlidir. .NET geliştiricilerine çözümler sunar ve belgeleriyle dijital olarak bağlantı kurup kontrol edebilmelerini, onları istedikleri gibi yönetmelerini sağlar.
2.1. IronOCR özellikleri
IronOCR, kullanıcıların teknik geçmişlerinden veya kullanılan donanımın karmaşıklık seviyesinden bağımsız olarak, grafikleri entegre etmek, imzalamak, dışa aktarmak, okumak ve görüntülerden ayrıntılar çıkarmak için benzersiz bir özellik ve işlev seti sunar.
2.1.1. Doğruluk
IronOCR SDK'sı, %99,8 doğruluk oranıyla diğer OCR kütüphanelerini önemli ölçüde geride bırakan doğruluğu sayesinde OCR kütüphaneleri için iş doğruluğunu tamamen yeni bir seviyeye taşır.
2.1.2. Düşük Kalitedeki Tarama ve Görüntüleri Düzeltme
IronOCR sınıfı, C# geliştiricilerine ayrıntılı kontrol imkanı sağlar. OCR (görüntüleri ve PDF'leri metne dönüştürme) özelliği geliştiricilerine sağlar ve her benzersiz durumda ince ayarlanmış performans sunar.
Gerçek dünya örnekleriyle çalışırken, hız ve doğruluk arasında mükemmel bir dengeye, değişkenler oluşturularak ulaşılabilir. Arka plan gürültüsünü temizle, kontrastı artır, çözünürlüğü artır, dil, strateji, döndür ve düzelt, renk alanı, koyu arka planlarda beyaz metni algıla ve giriş görüntü tipini algıla gibi sadece bazı seçenekler mevcuttur.
Aşağıda düşük kaliteli taramaların düzeltildiği öncesi-sonrası resim örnekleri verilmiştir:
Önce
Sonra
2.1.3. Diller
IronOCR, dünya çapındaki geliştiricilerin avantaj sağlaması için 125'ten fazla uluslararası dilde çözümler sunar.
2.1.4. OCR Metin Çıkarma
Iron Tesseract, çeşitli resim türlerini ve PDF dosyalarını okuyabilir. Bu özellik, geleneksel ücretsiz Tesseract motorları ile mümkün değildir. Tarama kalitesi düşükse, OCR girdisi, ilgili özellikleri otomatik olarak düzeltmenize olanak tanır.
2.1.5. Görüntü Optimizasyon Filtreleri
OCRInput sınıfı, C# programcılarına giriş üzerinde ayrıntılı kontrol sağlar. Geliştiriciler daha sonra görüntü girişini hız ve doğruluk için ön işlemden geçirirler. Bu, Photoshop Yığın Komut Dosyaları veya ImageMagick kullanarak OCR için fotoğrafları hazırlamanın standart yöntemini ortadan kaldırır.
2.1.6. Görüntünün OCR Bölgesi
Görüntü üzerinde hız ve doğruluk ile OCR gerçekleştirme açısından, IronOCR bunu tamamen yeni bir seviyeye taşır. IronOCR, son kullanıcılarına görüntüde belirli bir alan veya bölge seçme ve bu bölgede OCR gerçekleştirme imkanı tanır. Bölge, İçerikAlanları veya KırpmaAlanları olarak bilinir.
2.1.7. OCRResult Sınıfı
IronOCR, Tesseract 3, 4 veya 5 kullanarak taradığı her sayfa için ileri seviye bir sonuç nesnesi döndürür. Bu nesne, konum verileri, görüntüler, metin, istatistiksel güven, alternatif sembol seçenekleri, yazı tipi adları, yazı tipi boyutları, süslemeler, yazı tipi ağırlıkları ve aşağıdakilerin her biri için konum içerir:
- Sayfalar
- Paragraflar
- Metin Satırları
- Kelimeler
- Bireysel Karakterler
- Barkodlar
2.1.8. 1 Doküman için Birden Fazla Dil
IronOCR, geliştiricilerin tek bir belge için birden fazla dil kullanmalarına olanak tanır. Bu özellik .NET hizmet sağlayıcıları için büyük bir yardım sağlar.
Not:
IronOCR, ödüllü bir ürün hattının parçasıdır. Bu ödülü kazanarak, Iron Software gerçekten de muhteşem bir belge tarayıcı uygulaması sunduğunu, kusursuz tanıma, belgelerle ilgili mükemmel dönüşüm ve işleme sağladığını göstermektedir.
3. Visual Studio'da yeni bir proje başlatma
Visual Studio yazılımını açın, dosya menüsüne gidin ve yeni bir proje seçin. Ardından, konsol uygulamasını seçin.
Proje adını girin ve uygun metin kutusundaki yolu seçin. Sonra, oluştur düğmesini tıklayın ve ardından aşağıdaki ekran görüntüsünde olduğu gibi gerekli .NET çerçevesini seçin:
Visual Studio projesi şimdi seçilen uygulama için yapıyı oluşturacak ve eğer konsolu, Windows'u ve web uygulamasını seçtiyseniz, kodu girebileceğiniz ve uygulamayı oluşturup/çalıştırabileceğiniz program.cs dosyasını açacaktır.
Şimdi, programı test etmek için kütüphaneyi ekleyebiliriz.
4. IronOCR Kütüphanesini Yükleme
IronOCR kutuphanesi dört şekilde indirilebilir ve kurulabilir. Bunlar su sekildedir:
- Visual Studio NuGet Paket Yöneticisini Kullanma
- NuGet web sayfasından doğrudan indirme.
- IronOCR web sayfasından doğrudan indirme.
- Visual Studio Komut Satırını Kullanma.
4.1. Visual Studio NuGet Yöneticisini Kullanma
IronOCR'u bir C# projesine Visual Studio NuGet Paket Yöneticisi'ni kullanarak entegre edebilirsiniz.
- Araçlar'ı genişletin.
- NuGet Paket Yöneticisini genişletin.
- Çözümler için NuGet Paketlerini Yönet üzerine tıklayın.
Bunun ardından arama çubuğunda yeni bir pencere görünecek: IronOCR yazın.
Bu yöntemi kullanarak, geliştiriciler IronOCR kutuphanesini ve geliştiricinin tercih ettiği herhangi bir dil paketini yükleyebilir.
4.2. NuGet web sayfasından doğrudan indirme
IronOCR, aşağıdaki talimatları izleyerek NuGet web sitesinden doğrudan indirilebilir:
- "https://www.nuget.org/packages/IronOcr/" bağlantısına gidin
- Sağdaki menüden indirme paketi seçeneğini seçin.
- İndirilen paketi çift tıklayın. Otomatik olarak yüklenecektir.
- Ardından, çözümü yeniden yükleyerek projede kullanmaya başlayın.
4.3. IronOCR web sayfasından doğrudan indirme
Geliştiriciler, bu bağlantıyı kullanarak IronOCR kütüphanesini doğrudan IronOCR web sitesinden indirebilirler.
- Çözüm penceresinden projeyi sağ tıklayın.
- Daha sonra, Referans seçeneğini seçin ve indirilen referansın konumuna göz atın.
- Referansı eklemek için Tamam'a tıklayın.
4.4. Visual Studio Komut Satırını Kullanarak
- Visual Studio'da, Araçlar -> NuGet Package Manager -> Paket Yöneticisi Konsolu gidin.
- Paket yöneticisi konsolu sekmesine şu satırı girin:
Install-Package IronOcr
Paket şimdi mevcut projeye indirilecek/yüklenecek ve kullanıma hazır olacak.
5. LeadTools OCR'ı Yükleyin
Geliştiriciler, aşağıda gösterildiği gibi üç farklı şekilde LeadTools OCR SDK'sını indirebilir. Hepsini tartışacağız.
Visual Studio NuGet Paket Yöneticisini Kullanma.
- NuGet Web Sitesi'ni Kullanarak.
- LeadTools Web Sitesinden İndirerek.
5.1. Visual Studio NuGet Yöneticisi'ni Kullanarak
LeadTools OCR'ı bir C# projesinde Visual Studio NuGet Paket Yöneticisi'ni kullanarak yükleyebilirsiniz:
- Araçlar'ı genişletin.
- NuGet Paket Yöneticisini genişletin.
- Çözümler için NuGet Paketlerini Yönet üzerine tıklayın.
Bundan sonra, yeni bir pencere açılacaktır; arama çubuğuna LeadTools OCR yazın.
Bu adımları takip ederek, geliştiriciler LeadTools OCR kütüphanesini ve geliştiricinin tercih ettiği dil paketini yükleyebilir.
5.2. NuGet Web Sitesi'ni Kullanarak
Aşağıdaki talimatlar izlenerek LeadTools OCR, NuGet web sitesinden doğrudan indirilebilir:
- Bağlantıya gidin 'https://www.nuget.org/packages/Leadtools.Ocr/'
- Sağdaki menüden indirme paketi seçeneğini seçin.
- İndirilen paketi çift tıklayın. Otomatik olarak yüklenecektir.
- Ardından, çözümü yeniden yükleyerek projede kullanmaya başlayın.
5.3. LeadTools Web Sitesinden İndirin
Geliştiriciler, web sitelerinden LeadTools Belge SDK'sını doğrudan hiçbir zorluk yaşamadan indirebilirler. Sadece web sitelerine gidin ve OCR kütüphanesi içeren paketlerden birini indirin.
6. Çoklu İş Parçacığı OCR
Tartışılan her iki yazılım seti de çoklu iş parçacığı OCR motorları için hizmetler sağlar. Bu başlık altında, performansları ve hızları ile ilgileneceğiz.
6.1. LeadTools Çoklu İş Parçacığı OCR
LeadTools, her sistemin fiziksel çekirdeklerine bağlı olarak bir kerede birden fazla OCR örneği çalıştırmayı destekler. Lead Technologies'in bu özelliği, .NET geliştiricileri için çok fazla zaman tasarrufu sağlar.
// Create an instance of an OCR document from the engine
IOcrDocument ocrDocument = ocrEngineInstance.DocumentManager.CreateDocument();
// Add page, zone them, recognize them and save them to the final document
ocrDocument.Pages.AddPages(imageFileName, null);
ocrDocument.Recognize(null);
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, null);
// Create an instance of an OCR document from the engine
IOcrDocument ocrDocument = ocrEngineInstance.DocumentManager.CreateDocument();
// Add page, zone them, recognize them and save them to the final document
ocrDocument.Pages.AddPages(imageFileName, null);
ocrDocument.Recognize(null);
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, null);
' Create an instance of an OCR document from the engine
Dim ocrDocument As IOcrDocument = ocrEngineInstance.DocumentManager.CreateDocument()
' Add page, zone them, recognize them and save them to the final document
ocrDocument.Pages.AddPages(imageFileName, Nothing)
ocrDocument.Recognize(Nothing)
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, Nothing)
6.2. IronOCR Çoklu İş Parçacığı OCR
IronOCR'un çoklu iş parçacığı özelliğini kullanmak geliştiriciler için oldukça kolay ve zaman kazandırıcıdır. Iron Tesseract, tüm çekirdeklerde mevcut olan tüm iş parçacıklarını otomatik olarak kullanmayı deneyecek ve ana/GUI iş parçacığındaki yanıt verme hızını dikkatle değerlendirecektir.
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddPdf("scan.pdf");
// Image processing is automatically multithreaded
Input.Deskew();
// OCR reading is automatically multi-threaded too
var Result = Ocr.Read(Input);
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddPdf("scan.pdf");
// Image processing is automatically multithreaded
Input.Deskew();
// OCR reading is automatically multi-threaded too
var Result = Ocr.Read(Input);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.AddPdf("scan.pdf")
' Image processing is automatically multithreaded
Input.Deskew()
' OCR reading is automatically multi-threaded too
Dim Result = Ocr.Read(Input)
End Using
7. Aranabilir PDF'ler Oluşturun
Kolayca aranabilir PDF'ler oluşturmak her bir C# geliştiricisinin hayalidir. Bu bölümde, bu süreci hem IronOCR SDK'sını hem de Lead Technologies OCR SDK'sını kullanarak tartışacağız.
7.1. IronOCR ile Aranabilir PDF'ler Oluşturun
IronOCR'un harika belge tarayıcı uygulaması, geliştiricilerin aranabilir PDF'ler oluşturma seviyesini, görüntülerdeki metin karakterlerini algılama desteği sunarak ve bunları anlamlı PDF metnine dönüştürerek yeni bir seviyeye taşımalarına olanak tanır. Kullanıcılar için kod örneği aşağıdadır:
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.Add(@"images\page1.png");
Input.Add(@"images\page2.bmp");
Input.Add(@"images\page3.tiff");
Input.Deskew();
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.Add(@"images\page1.png");
Input.Add(@"images\page2.bmp");
Input.Add(@"images\page3.tiff");
Input.Deskew();
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.Add("images\page1.png")
Input.Add("images\page2.bmp")
Input.Add("images\page3.tiff")
Input.Deskew()
Dim Result = Ocr.Read(Input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
7.2. LeadTools OCR ile Aranabilir PDF'ler Oluşturun
Lead Technologies, ödüllü yazılım serisinden harika bir belge tarayıcı uygulaması sunar. Ancak, son kullanıcı için, kod IronOCR için kullanılan koda göre biraz daha karmaşıktır.
private void saveAsSearchablePDFToolStripMenuItem_Click(object sender, EventArgs e)
{
try
{
// Create a document
using (IOcrDocument ocrDocument = _ocrEngine.DocumentManager.CreateDocument(null, OcrCreateDocumentOptions.AutoDeleteFile))
{
// Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose);
// Recognize Text
_ocrPage.Recognize(null);
// Add the page
ocrDocument.Pages.Add(_ocrPage);
// Save page as documentation
SaveFileDialog saveDlg = new SaveFileDialog();
saveDlg.InitialDirectory = @"C:\LEADTOOLS22\Resources\Images";
saveDlg.Filter = "Adobe Portable Document Format|*.pdf";
if (saveDlg.ShowDialog(this) != DialogResult.OK)
return;
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, null);
MessageBox.Show($"OCR output saved to {saveDlg.FileName}");
}
}
catch (Exception ex)
{
MessageBox.Show(ex.ToString());
}
}
private void saveAsSearchablePDFToolStripMenuItem_Click(object sender, EventArgs e)
{
try
{
// Create a document
using (IOcrDocument ocrDocument = _ocrEngine.DocumentManager.CreateDocument(null, OcrCreateDocumentOptions.AutoDeleteFile))
{
// Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose);
// Recognize Text
_ocrPage.Recognize(null);
// Add the page
ocrDocument.Pages.Add(_ocrPage);
// Save page as documentation
SaveFileDialog saveDlg = new SaveFileDialog();
saveDlg.InitialDirectory = @"C:\LEADTOOLS22\Resources\Images";
saveDlg.Filter = "Adobe Portable Document Format|*.pdf";
if (saveDlg.ShowDialog(this) != DialogResult.OK)
return;
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, null);
MessageBox.Show($"OCR output saved to {saveDlg.FileName}");
}
}
catch (Exception ex)
{
MessageBox.Show(ex.ToString());
}
}
Private Sub saveAsSearchablePDFToolStripMenuItem_Click(ByVal sender As Object, ByVal e As EventArgs)
Try
' Create a document
Using ocrDocument As IOcrDocument = _ocrEngine.DocumentManager.CreateDocument(Nothing, OcrCreateDocumentOptions.AutoDeleteFile)
' Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose)
' Recognize Text
_ocrPage.Recognize(Nothing)
' Add the page
ocrDocument.Pages.Add(_ocrPage)
' Save page as documentation
Dim saveDlg As New SaveFileDialog()
saveDlg.InitialDirectory = "C:\LEADTOOLS22\Resources\Images"
saveDlg.Filter = "Adobe Portable Document Format|*.pdf"
If saveDlg.ShowDialog(Me) <> DialogResult.OK Then
Return
End If
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, Nothing)
MessageBox.Show($"OCR output saved to {saveDlg.FileName}")
End Using
Catch ex As Exception
MessageBox.Show(ex.ToString())
End Try
End Sub
8. Uyumluluk
Bu bölüm, bu yazılım paketlerinin farklı platformları desteklemek için sağladığı hizmetlerle ilgilidir. Bu yazılım paketlerinin her ikisi de birçok platform ve işletim sistemini destekler.
8.1 IronOCR Uyumluluğu
IronOCR .NET SDK, neredeyse tüm .NET platformları ve C# programlama dilini destekleyen işletim sistemleri ile uyumlu olan en iyi OCR SDK'sıdır. IronOCR ayrıca JPEG, JPG, TIFF ve daha birçok görüntü formatı için destek sağlar.
.NET Dilleri:
- C#
- VB.NET
- F#
Platformlar:
- .NET 5
- .NET Core 2x ve 3x
- .NET Standard 2
- .NET Framework 4x
Uygulama Türleri:
- Konsol, Web ve Masaüstü
OS:
- Microsoft Windows
- Linux (Debian, CentOS, Ubuntu)
- Mac-OS
- Docker (Windows, Linux, Azure)
- Azure (VPS, Web uygulamaları, Web sitesi, Fonksiyonlar)
IDE'ler:
- Microsoft Visual Studio
- Jetbrains ReSharper ve Rider
8.2 LeadTools Uyumluluğu
Lead Technologies, ayrıca farklı platformlarda çeşitli ürün ve uygulamalarının entegrasyonu için destek sağlar. Lead Technologies, ayrıca kullanıcılar ve geliştiriciler için mükemmel SDK desteği sağlar.
Dağıtım İçin İşletim Sistemleri
- Windows
- Mac-OS 10.10
- iOS 8.0
- Android 4.0 +
Bileşen Türü
- .NET
- C#, VB, C++/CLI, XAML
- WinForms, WPF, Web Forms
- Web Servisleri
- iOS ve mac-OS
- Android
- Linux
Uyumlu Kaplar
- Microsoft Visual Studio
- .NET Framework 4.5
- .NET Framework 4.0
- .NET Framework 3.5
- .NET Framework 3.0
- .NET Framework 2.0
9. Lisanslama
Yukarıda bahsedilen yazılımın herhangi birinin kullanımı için lisans gereklidir. Her iki yazılım seti de ortama giriş yapmadan önce lisansların tutulmasını gerektirir. Bir kez giriş yaptığınızda, yalnızca o zaman onların tamamen yeni yazılım teknolojileri seviyesine erişmeye başlayabilirsiniz.
9.1. LeadTools Lisanslama
LeadTools, SDK lisansında iki (2) ana lisans bileşeni sağlar:
- Bir 'Geliştirme Lisansı', bir programcıya SDK'yı geliştirme için kullanmasına izin verir.
- Bir 'Dağıtım Lisansı', müşterinin SDK yeniden dağıtılabilir dosyalarını kullanarak oluşturulan son kullanıcı uygulamasını dağıtmasına veya dağıtmasına izin verir.
Geliştirme Lisansı
LEADTOOLS ile geliştirme yapmak için bir Geliştirme Lisansına ihtiyaçınız olacak. Geliştirme Lisansı doğrudan LEAD'den veya LEAD yetkili satıcısı veya distribütörü aracılığıyla satın alınabilir.
Geliştirme Lisansı, bir müşterinin SDK'yı bir geliştirme makinesine kurmasını ve SDK örnek kodunu ve belgelerini kullanarak belirli yeniden dağıtılabilir kitaplıkları ve dosyaları uygulamaya dahil ederek son kullanıcı uygulaması oluşturmasını sağlar.
Dağıtım Lisansı
SDK ile geliştirilen son kullanıcı uygulamasının ('Son Kullanıcı Yazılımı') kullanımı, Dağıtım Lisansı ile belirlenir.
Uygulamanın herhangi bir kopyalanmasını yasaklayan standart bir son kullanıcı uygulaması lisans sözleşmesinden farklı olarak, bir SDK lisansı kullanıcıya SDK'nın bir kısmını kopyalama ve yeniden dağıtma izni verir. LEAD'in fikri mülkiyetini çoğaltmak ve LEAD SDK kullanılarak üretilen son kullanıcı yazılımı ile dağıtmak için, LEAD'in müşterileri gerekli dağıtım lisansını almalıdır.
9.1.2. Fiyatlandırma
LeadTools geliştiricileri için ücretsiz lisans sağlamaz. Bunun yerine, kapsamlı geliştirici tabanlı lisanslama sunar. Lead Technologies OCR SDK fiyat yapısını görmek için burayı ziyaret edin.
9.2. IronOCR Lisanslama
IronOCR, bir geliştirici lisansını ücretsiz olarak sunan bir kütüphanedir. IronPDF ayrıca farklı bir fiyat yapısına sahiptir; Lite paketi, gizli ücret olmadan $799 ile başlar. SaaS ve OEM ürünlerinin dağıtımı da mümkündür. Tüm lisanslar 30 günlük para iade garantisi, bir yıllık yazılım desteği ve güncellemeler, dev/staging/production geçerliliği ve süresiz lisans (tek seferlik satın alma) ile birlikte gelir. IronOCR'un tam fiyat yapısını ve lisanslama detaylarını görmek için burayı ziyaret edin.
SaaS ve OEM ürünlerinin yeniden dağıtımını telifsiz bir şekilde tek seferlik satın alma ile elde edebilirsiniz $1,599.
10. Özet ve Sonuç
10.1. Özet
IronOCR, dünyanın en güçlü Tesseract motoru olan Iron Tesseract adında bir .NET SDK kütüphanesidir. 125'ten fazla uluslararası dili destekler. IronOCR, bir görüntünün OCR bölgesi, görüntülerden metin çıkarma, düşük çözünürlüklü bir görüntüyü düzeltme ve bir görüntünün belirli bir bölgesinde OCR yapma gibi birçok görüntüleme özelliği olan harika bir doküman tarayıcı uygulaması sağlayan bir kütüphanedir. IronOCR, hız ve doğruluğu bir arada sağlamaya odaklanır ve %99,8 doğruluk oranı, diğer tüm OCR Tesseract'larından daha yüksektir. IronOCR, performans ayarları yapmaya veya giriş görüntülerini ağır bir şekilde değiştirmeye gerek kalmadan kutusundan çıkarıldığı gibi çalışır. Bunların üzerine, her zaman Iron Software'ın beş ürününü sadece iki ürün fiyatına alabilirsiniz. Web sayfasını görmek için buraya tıklayın.
- IronPDF
- IronOCR
- IronXL
- Iron Barcode
- IronWebScraper
LeadTools OCR, LeadTools'tan hızlı ve verimli bir şekilde çoğu tanıma özelliği sağlayan bir araç setidir. Programcılar, belge resimlerinde karakter tanıma yapabilir ve tanınan metni LEADTOOLS OCR sınıf kütüphanesini kullanarak 20'den fazla dosya formatına çıktı alabilir. Kütüphanesi, mevcut olan hemen hemen tüm programlama dilleri ve platformlar ile entegre edilebilir. Özellikleri şunları içerir:
- Çoklu iş parçacığı desteği ile Hızlı ve Doğru OCR
- Latin, Kiril, Uzak Asya ve Arapça da dahil olmak üzere geniş OCR dil karakter seti desteği
- Aranabilir PDF, PDF/A, Word ve XML dahil olmak üzere 40'tan fazla çıktı formatına OCR sonuçlarını kaydetme
- Tam sayfa ve bölgesel OCR
- OCR sonuçlarını iyileştirmek için yerleşik ve özel yazım sözlükleri
- Tarama görüntülerinden OCR sonuçlarını iyileştirmek için güçlü belge görüntü temizleme ve ön işleme fonksiyonları
10.2. Sonuç
IronOCR ve LeadTools OCR, her ikisi de en üst düzey araçlardır ve bir C# veya .NET geliştiricisinin isteyebileceği tüm özellikleri sağlar. IronOCR, rakibinden daha kolay kullanım ve kodlama sağlamaktadır. Her iki yazılım seti de yerel maliyetlere neden olmaz, ancak IronOCR, LeadTools OCR Kütüphanesi'nden çok daha fiyat-etkin. IronOCR, mevcut olan herhangi bir rakibinden daha fazla doğruluk sağlar. IronOCR, 125'ten fazla diller için uluslararası dil desteği sunar. Öte yandan, LeadTools sadece 40'tan fazla dil için destek sağlar. Performansın çeşitli yönlerini dikkate alarak, çıkarabileceğimiz tek sonuç, IronOCR'nin LeadTools OCR'ye göre önemli avantajlar sunduğu yönündedir.
Sıkça Sorulan Sorular
Düşük kaliteli taramalarda OCR doğruluğunu nasıl artırabilirim?
IronOCR, düşük çözünürlüklü görüntülerin kalitesini artırarak OCR doğruluğunu artırmak için Temiz Arka Plan Gürültüsü, Kontrastı Arttır, Çözünürlüğü Arttır ve Koyu Arka Planlarda Beyaz Metni Algıla gibi özellikler sunar.
Bu kütüphane ile çok dilli OCR belgeleri oluşturabilir miyim?
Evet, IronOCR 125'ten fazla dili destekler ve geliştiricilerin birden fazla dilde dokümanları işleyip oluşturmasına olanak tanır, bu da çok dilli OCR uygulamaları için uygundur.
Bu OCR kütüphanesini kullanmak için sistem gereksinimleri nelerdir?
IronOCR, .NET platformları ile uyumludur ve Windows, Linux ve macOS işletim sistemlerinde kullanılabilir. Visual Studio ve Jetbrains ReSharper & Rider gibi geliştirme ortamlarıyla iyi entegre olur.
Bu OCR kütüphanesi farklı doküman formatlarını nasıl işler?
IronOCR, çeşitli resim formatlarını işleyebilir ve onları metin veya PDF dosyalarına dönüştürebilir, arama yapılabilir PDF'ler ve diğer doküman türlerinin oluşturulmasını sağlar.
Bu OCR kütüphanesini kullanmanın bağlantılı bir lisanslama ücreti var mı?
IronOCR, diğer OCR kütüphanelerine kıyasla daha maliyet etkili olan doğrudan bir lisanslama modeli sunar, bazı alternatifler için gerekli ayrı geliştirme ve dağıtım lisanslarından kaçınılır.
Bu OCR aracının dil desteği diğerlerine kıyasla nasıl?
IronOCR, 125'ten fazla dili destekler, bu da birçok diğer OCR aracından önemli ölçüde daha fazladır ve geniş dil desteği gerektiren uygulamalar için mükemmel bir seçim yapar.
Bu OCR kütüphanesi, C# geliştiricileri için diğerlerine göre neden iyi bir seçimdir?
IronOCR, %99,8 doğruluk oranı, .NET projelerine kolay entegrasyon, geniş dil desteği ve maliyet etkili lisanslamasıyla dikkat çeker, bu da C# geliştiricileri için tercih edilen bir seçenek yapar.
Bu OCR kütüphanesi sunucu tabanlı uygulamalarda kullanılabilir mi?
Evet, IronOCR çoklu iş parçacığı desteği sağlar ve sunucu tabanlı uygulamalarda büyük OCR görevlerini verimli bir şekilde işlemek için kullanılabilir.



