IronOCR ile Abbyy Finereader Arasında Bir Karşılaştırma
Bu makalede, OCR için PDF dokümanları ve görüntüler üzerinde kullanılan iki yaygın kutuphane ve uygulamayı karşılaştıracağız. Bunlar su sekildedir:
- ABBYY FineReader PDF Yazılımı
- IronOCR
C#'ta Abbyy Finereader SDK nasıl kullanılır?
- C#'ta OCR yapmak için Abbyy Finereader SDK'yı kurun
- Görüntü ve PDF belgelerini Microsoft Word, aranabilir PDF, CSV ve metne dönüştürün
- PDF dosyalarından düzenlenebilir PDF oluşturun
- PDF/A-1'den PDF/A-3'e ve PDF/UA'ya destek verin
- Tüm türdeki belgeleri dijitalleştirmek, almak, düzenlemek, korumak, paylaşmak ve işbirliği yapmak için en son yapay zeka tabanlı OCR teknolojisini kullanın
1. Tanıtım
1.1 ABBYY FineReader PDF — Giriş ve Özellikler
ABBYY FineReader PDF, ABBYY tarafından oluşturulan bir optik karakter tanıma (OCR) uygulamasıdır. Görüntü belgeleri (resimler, taramalar, PDF dosyaları) ve ekran görüntülerini, Microsoft Word, Microsoft Excel, Microsoft PowerPoint, Zengin Metin Biçimi, HTML, PDF/A, aranabilir PDF, CSV ve metin (düz metin) gibi düzenlenebilir dosya formatlarına dönüştürmemizi sağlar.
ABBYY FineReader, hem Windows, Linux hem de macOS için mevcut olan masaüstü bir uygulamadır. Ayrıca, PDF dosyaları için düzenlenebilir formatların oluşturulmasına da olanak tanır. PDF'leri, Adobe Acrobat ile olduğu gibi okuyabiliriz. ABBYY FineReader taranan belgeleri dijital iş akışlarına entegre eder.
Belgeleri basit ve verimli bir şekilde yönetip tamamlayarak zaman ve çaba tasarrufu sağlayın. İster dijital olarak oluşturulmuş ister kağıttan dönüştürülmüş olsun, aynı metodik şekilde herhangi bir belge ile çalışın. PDF'nizi önce dönüştürmek zorunda kalmadan, metinleri, tabloları ve tüm yerleşimi değiştirebilirsiniz.
ABBYY FineReader PDF, kağıt belgelerden veya neredeyse her uygulamadan bir PDF yazıcısına baskı yaparak, 25'ten fazla farklı dosya formatından PDF'ler oluşturabilir. Uzun süreli arşivleme için PDF/A-1'den PDF/A-3'e kadar destek sağlanır ve PDF/UA, ekran okuyucular gibi yardımcı yazılımlar kullanıldığında içeriğin erişilebilir olmasını sağlar. Aynı zamanda profesyonellere dijital iş yerinde verimliliği en üst düzeye çıkarmaları için yetki verir.
ABBYY FineReader kullanarak kendi etkileşimli PDF formlarınızı oluşturun ve güncelleyin, bilgileri başarıyla toplayın ve belgeleri standart hale getirin. Çeşitli türlerde etkileşimli alanları birleştirerek, eylemler belirleyerek, mevcut PDF formlarını düzenleyerek veya geleneksel bir PDF'ye form elemanları ekleyerek formlar oluşturun.
ABBYY FineReader, kağıt belgeleri, taramaları ve taranmış PDF'leri anında taranabilir PDF'lere dönüştürebilir, böylece belgeleri dijital arşivlerden alabilirsiniz ve içerdiği bilgilere erişebilirsiniz. FineReader PDF, PDF/A formatının tüm uyumluluk seviyelerini ve varyantlarını destekler, sektörde uzun süreli arşivleme standardı olan PDF/A-1'den PDF/A-3'e kadar.
ABBYY'nin en son yapay zeka tabanlı OCR teknolojisi, FineReader PDF, aynı iş akışlarında belgeleri dijital hale getirmeyi, almayı, düzenlemeyi, korumayı, paylaşmayı ve iş birliği yapmayı kolaylaştırır. FineReader ayrıca belgelerin karşılaştırılmasını içerir, bu da bize orijinal belgeleri, dönüştürülmüş PDF'leri ve görüntü dosyalarını karşılaştırmamızda yardımcı olur.
1.2 IronOCR — Giriş ve Özellikler
IronOCR, IronOCR for .NET'i, .NET uygulamaları ve web sitelerindeki fotoğraf ve PDF'lerden metin içeriği okumak için kullanan mühendisler için yazılım sağlar. Fotoğrafları metin ve barkodlar için tarar ve pek çok dünya dilini destekler; sonrasında çıktıyı ya düzyazı metin ya da yapılandırılmış veri olarak sağlayabilir. Iron Software'in OCR kütüphanesi MVC, Web, konsol ve masaüstü .NET uygulamalarında kullanılabilir. Ticari dağıtımlar için, geliştirme ekibinden doğrudan yardım ile lisans sağlanır.
- En son Tesseract 5 motorunu kullanarak, IronOCR herhangi bir resim veya PDF formatından metin, barkodlar ve QR kodları okur. Bu kütüphane hızlı bir şekilde masaüstü, konsol ve web uygulamalarına OCR ekler.
- IronOCR, 125 uluslararası dili destekler. Ayrıca özel dil ve kelime listelerini de destekler.
- IronOCR, 20'den fazla barkod formatını ve QR kodlarını okuyabilir.
- IronOCR, çok sayfalı gif ve tiff görüntü formatlarını destekler.
- IronOCR, düşük kaliteli taranmış görüntüler için düzeltme sağlar.
- IronOCR çok iş parçacığını destekler — bir veya daha fazla işlemi aynı anda yürütür.
- IronOCR, sayfalar, paragraflar, satırlar, kelimeler, karakterler vb. için yapılandırılmış veri çıktısı sağlayabilir.
- IronOCR, Windows, Linux, macOS gibi çeşitli işletim sistemlerini destekler.
2. Visual Studio'da Yeni Proje Oluşturma
Visual Studio yazılımını açın ve "dosya menüsü"ne gidin. "yeni proje"yi seçin, ardından "Konsol Uygulaması"nı seçin.
Proje adını girin ve ilgili metin kutusunda dosya yolunu seçin. Ardından, yarat butonuna tıklayın ve aşağıdaki ekran görüntüsündeki gibi gerekli .NET Framework'ü seçin.
Visual Studio projesi, seçilen uygulama için şimdi yapıyı oluşturacaktır. Konsolu, Windows'u ve web uygulamasını seçtiyseniz, şimdi kodu girebileceğiniz ve uygulamayı derleyip/çalıştırabileceğiniz Program.cs dosyası açılacaktır.
Sonraki adımda, kodu test etmek için kutuphaneyi ekleyebiliriz.
3. Kurulum
3.1 ABBYY FineReader PDF'yi Kur
ABBYY FineReader'ı buradan indirebiliriz.
Yukarıdaki resim, gereksinimlerinize göre indirebileceğiniz Bireysel ve İşletme olmak üzere iki sürüm olduğunu göstermektedir. "Ücretsiz denemeyi indir" seçeneğini seçin. Sizi aşağıdaki görüntüdeki gibi bir forma yönlendirecektir:
EXE dosyası konumunu almak için formu doldurmamız gerekecek. Dosyayı indirmek için indirme seçeneğine tıklayın.
Dosya indirme tamamlandıktan sonra, kurulum başlatmak için EXE dosyasına çift tıklayabiliriz. Tamamlandığında, bir açılır mesaj görüntülenecek ve artık kullanıma hazır.
3.2 IronOCR'yi Kur
IronOCR Library dört farklı şekilde indirilebilir ve kurulabilir.
Bunlar su sekildedir:
- Visual Studio Kullanımı
- Visual Studio Komut Satırı Kullanımı
- NuGet web sitesinden doğrudan indirme
- IronPDF web sitesinden doğrudan indirme
3.2.1 Visual Studio Kullanarak
Visual Studio yazılımı, paketi doğrudan çözümleme üzerine yüklemek için NuGet Paket Yöneticisi seçeneğini sunar. Aşağıdaki ekran görüntüsü, NuGet Paket Yöneticisini nasıl açacağınızı gösterir.
NuGet web sitesinden paket listesini göstermek için bir arama kutusu sağlar. Paket yöneticisinde, aşağıdaki ekran görüntüsünde olduğu gibi IronOCR anahtar kelimesini aramamız gerekecek:
Yukarıdaki resimden, ilgili arama öğelerinin listesini alacağız. Paketi çözümünüze yüklemek için gerekli olan seçeneği seçmemiz gerekir.
3.2.2 Visual Studio Komut Satırı Kullanarak
Visual Studio'da Araçlar -> NuGet Paket Yöneticisi -> Paket Yöneticisi Konsolu'na gidin.
Paket Yöneticisi Konsolu sekmesine aşağıdaki satırı girin:
Install-Package IronOcr
Bu komut paketi mevcut projeye indirir ve kurar ve kullanıma hazır hale getirir.
3.2.3 NuGet web sitesinden doğrudan indirme
Üçüncü yol, NuGet paketini doğrudan web sitesinden indirmektir.
- Navigate to the Link.
- Sağ taraftaki menüden indirme paketi seçeneğini seçin.
- İndirilen paketi çift tıklayın. Otomatik olarak yüklenecektir.
- Ardından, çözümü yeniden yükleyin ve projede kullanmaya başlayın.
3.2.4 IronOCR web sitesinden doğrudan indirme
Click the link here to download the latest package direct from the website. Once downloaded, follow the steps below to add the package to the project.
- Çözüm penceresinden projeyi sağ tıklayın.
- Ardından "Referans Ekle" seçeneğini seçin ve indirilen referansın konumuna göz atın.
- Ardından, başvuruyu eklemek için Tamam'a tıklayın.
4. OCR Görüntü
Hem IronOCR hem de ABBYY FineReader, resmi metne dönüştüren OCR teknolojisine sahiptir.
4.1 ABBYY FineReader PDF Kullanarak
Ardından, aşağıdaki resimde olduğu gibi birden çok seçenekle açılacak olan ABBYY FineReader PDF uygulamasını açın.
Ardından, OCR Editörü seçeneklerinden "Aç" seçeneğini seçin. Bu, resim dosyalarını seçmek için bir seçenek sunacaktır:
Bir dosya seçildikten sonra, otomatik olarak görüntüyü düzenlenebilir metne dönüştürmeye başlar ve ardından sonucu aşağıdaki ekran görüntüsündeki gibi pencerede gösterir:
Yukarıdaki resim, kaynak resmin düzenlenebilir metne dönüştürüldüğünü göstermektedir. Ancak, sonuç çok doğru değildir. Bazı numaralar ABBYY FineReader PDF uygulaması tarafından tanınmamaktadır. Bu, karşılaştırma pencerelerinde açıkça gösterilmiştir - sol tarafta kaynak resim, sağ tarafta OCR ile dönüştürülmüş metin bulunmaktadır.
4.2 IronOCR Kullanarak
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Configure OCR language and Tesseract version
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
// Create a new OcrInput object to manage input images
using (var Input = new OcrInput())
{
// Add an image to the input for processing
Input.AddImage(@"3.png");
// Perform OCR to read text from the image
var Result = Ocr.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
Console.ReadKey();
}
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Configure OCR language and Tesseract version
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
// Create a new OcrInput object to manage input images
using (var Input = new OcrInput())
{
// Add an image to the input for processing
Input.AddImage(@"3.png");
// Perform OCR to read text from the image
var Result = Ocr.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
Console.ReadKey();
}
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()
' Configure OCR language and Tesseract version
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
' Create a new OcrInput object to manage input images
Using Input = New OcrInput()
' Add an image to the input for processing
Input.AddImage("3.png")
' Perform OCR to read text from the image
Dim Result = Ocr.Read(Input)
' Output the extracted text to the console
Console.WriteLine(Result.Text)
Console.ReadKey()
End Using
Yukarıda, resim dosyalarını metne dönüştürmemize olanak tanıyan Tesseract 5 API'si gösterilmektedir. Yukarıdaki kod parçacığında IronTesseract örneği oluşturuyoruz. Ayrıca, bir veya daha fazla görüntü dosyası eklememize izin verecek bir OcrInput nesnesi kullanıyoruz. OcrInput nesne yöntemi AddImage kullanılırken kodun içinde mevcut resmin yolunu sağlamalıyız. Herhangi bir sayıda görüntü eklenebilir. Önceden oluşturduğumuz IronTesseract nesnesindeki Read fonksiyonu, resim dosyasını işleyerek OCR işlemi yapabilir ve sonucu OCR sonucuna çıkartabilir. Görüntülerden metin çıkarabilme ve bunu bir string'e dönüştürebilme kapasitesine sahiptir.
Çoklu çerçeve görüntüleri eklemek için Tesseract'ı da kullanabiliriz. AddMultiFrameTiff bu işlem için farklı bir yöntemdir. Tesseract kütüphanesi görüntüdeki her çerçeveyi okur ve her çerçeve ayrı bir sayfa olarak muamele görür. İşlem görüntünün ilk çerçevesini okuyacak ve ardından bir sonraki çerçeveye geçecek, ve bu böylece devam edecek, ta ki görüntünün tüm çerçeveleri taranana kadar. Bu yöntem yalnızca tiff görüntü formatını destekler.
Yukarıdaki resim, IronOCR sonucunun çıktısıdır, bu doğru ve verilerin düzenlenebilir metne doğru bir şekilde dönüştürüldüğünü göstermektedir.
5. OCR PDF Dosyası
IronOCR ve ABBYY FineReader PDF, PDF dosyasını düzenlenebilir metne dönüştürmeye yardımcı olacaktır. ABBYY FineReader PDF kullanıcılara sayfayı kaydet, resmi düzenle, sayfayı tanı vb. gibi bir dizi seçenek sunar. Ayrıca txt, belge, HTML formatı gibi kaydetme seçenekleri de sunar. IronOCR de dönüştürülmüş OCR dosyalarını HTML, txt, pdf vb. olarak kaydetmemize olanak tanır.
5.1 ABBYY FineReader PDF Kullanarak
ABBYY FineReader PDF yazılımını açın. Bu, aşağıdaki resimdeki gibi birçok seçenek sunan bir sayfa açacaktır.
Ardından, OCR Editörü seçeneklerinden "Aç" seçeneğini seçin. Bu, resim/PDF seçmek için bir seçenek sunacaktır. Bir PDF ya da resim seçebiliriz, ya da her iki dosyayı da seçebiliriz.
Dosya seçildikten sonra, Tamam düğmesine tıklayın. Otomatik olarak görüntüyü düzenlenebilir metne dönüştürmeye başlayacak ve sonucu aşağıdaki ekran görüntüsündeki gibi bir pencerede gösterecektir.
Yukarıdaki resim, kaynak PDF'in düzenlenebilir metne dönüştürüldüğünü göstermektedir. Ancak sonuç tamamen doğru değil. Bazı numaralar ABBYY FineReader PDF uygulaması tarafından tanınmıyor. Bu, karşılaştırma pencerelerinde açıkça gösterilmiştir - sol tarafta kaynak PDF, sağ tarafta OCR ile dönüştürülmüş metin bulunmaktadır.
5.2 IronOCR Kullanarak
OCRInput'u PDF dosyalarını yönetmek için de kullanabiliriz. Iron Tesseract sinifi, belgelerin her sayfasini okuyacak. Metin daha sonra sayfalardan çikarilacak. Belgelere PDF eklememize olanak tanıyan ikinci bir fonksiyon olan AddPdf kullanarak korumalı belgeleri de açabiliriz (belge korunuyorsa şifresi ile). Asagidaki kod, sifre korumali bir PDF belgesinin nasıl açilacagini gösteriyor:
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Create OcrInput to manage input PDFs
using (var Input = new OcrInput())
{
// Add a password-protected PDF to the input
Input.AddPdf("example.pdf", "password");
// Perform OCR to read text from the PDF
var Result = Ocr.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
}
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Create OcrInput to manage input PDFs
using (var Input = new OcrInput())
{
// Add a password-protected PDF to the input
Input.AddPdf("example.pdf", "password");
// Perform OCR to read text from the PDF
var Result = Ocr.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
}
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()
' Create OcrInput to manage input PDFs
Using Input = New OcrInput()
' Add a password-protected PDF to the input
Input.AddPdf("example.pdf", "password")
' Perform OCR to read text from the PDF
Dim Result = Ocr.Read(Input)
' Output the extracted text to the console
Console.WriteLine(Result.Text)
End Using
Ayrica Iron Tesseract tarafindan sunulan su yöntemler de vardir:
AddPdfPageAddPdfPages
Bir PDF belgesindeki tek bir sayfadan içerik okuma ve çıkartma işlemini AddPdfPage kullanarak yapabiliriz. Yalnizca metin çikarmak istedigimiz sayfa numarasini belirtmemiz gerekiyor. AddPdfPages, belirttiğimiz birden fazla sayfadan metin çıkarmamıza olanak tanır. IEnumerable<int>, sadece sayfa sayısını belirtmemiz yeterlidir. Ayrica dosya konumunu ve dosyanin uzantisini da eklememiz gerekiyor. Bu, asagidaki kod örneginde gösterilmektedir:
// Define numbers representing pages to extract from the PDF
IEnumerable<int> numbers = new List<int> { 2, 8, 10 };
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Create OcrInput to manage input PDFs
using (var Input = new OcrInput())
{
// Add a specific page from PDF for OCR
// Input.AddPdfPage("example.pdf", 10);
// Add multiple specific pages from PDF for OCR
// Input.AddPdfPages("example.pdf", numbers);
// Perform OCR to read text from the specified pages
var Result = Ocr.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
// Save the extracted text to a file
Result.SaveAsTextFile("ocrtext.txt");
}
// Define numbers representing pages to extract from the PDF
IEnumerable<int> numbers = new List<int> { 2, 8, 10 };
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Create OcrInput to manage input PDFs
using (var Input = new OcrInput())
{
// Add a specific page from PDF for OCR
// Input.AddPdfPage("example.pdf", 10);
// Add multiple specific pages from PDF for OCR
// Input.AddPdfPages("example.pdf", numbers);
// Perform OCR to read text from the specified pages
var Result = Ocr.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
// Save the extracted text to a file
Result.SaveAsTextFile("ocrtext.txt");
}
' Define numbers representing pages to extract from the PDF
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()
' Create OcrInput to manage input PDFs
Using Input = New OcrInput()
' Add a specific page from PDF for OCR
' Input.AddPdfPage("example.pdf", 10);
' Add multiple specific pages from PDF for OCR
' Input.AddPdfPages("example.pdf", numbers);
' Perform OCR to read text from the specified pages
Dim Result = Ocr.Read(Input)
' Output the extracted text to the console
Console.WriteLine(Result.Text)
' Save the extracted text to a file
Result.SaveAsTextFile("ocrtext.txt")
End Using
SaveAsTextFile fonksiyonunu kullanarak, sonucu bir metin dosyası olarak depolayabilir ve dosyayı çıktı dizin yoluna indirebiliriz. SaveAsHocrFile kullanarak dosyayı bir HTML dosyası olarak da kaydedebiliriz.
6. Diğer Özellikler
6.1 ABBYY FineReader PDF Kullanimi
FineReader'in bazi ek seçenekleri vardir, örnegin: Metin Alani Çiz, Resim Alani Çiz, Tablo Alani Çiz, Tanima Alani Çiz, vb. Bunlar, kullanicinin OCR performansini iyilestirmesine yardimci olur. Ayrica OCR yapma islevine ek olarak, uygulama kullanicilarin PDF birlestirme, PDF bölme, PDF düzenleme gibi işlemleri tamamlama kabiliyeti de verir.
6.2 IronOCR Kullanimi
IronOCR, taranmis belgelerden barkod ve QR kodlarini okumamizi saglayan benzersiz özelliklere sahiptir. Asagidaki kod, bir görüntü veya belgeden barkodlari nasıl okuyabilecegimizi gösterir.
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Configure OCR language and barcode reading
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
// Create OcrInput to manage input images
using (var Input = new OcrInput())
{
// Add an image containing barcodes
Input.AddImage("barcode.gif");
// Perform OCR to read text and barcodes from the image
var Result = Ocr.Read(Input);
// Iterate through detected barcodes and output their values
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
}
}
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Configure OCR language and barcode reading
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
// Create OcrInput to manage input images
using (var Input = new OcrInput())
{
// Add an image containing barcodes
Input.AddImage("barcode.gif");
// Perform OCR to read text and barcodes from the image
var Result = Ocr.Read(Input);
// Iterate through detected barcodes and output their values
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
}
}
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()
' Configure OCR language and barcode reading
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
' Create OcrInput to manage input images
Using Input = New OcrInput()
' Add an image containing barcodes
Input.AddImage("barcode.gif")
' Perform OCR to read text and barcodes from the image
Dim Result = Ocr.Read(Input)
' Iterate through detected barcodes and output their values
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
Next Barcode
End Using
Yukaridaki kod, bir görüntü veya PDF belgesinden barkodlari okumaya yardimci olur. Bir sayfa/görüntüden birden fazla barkodu okuyabilir. Barkodu okumak için, IronOCR'un barkodu okumasına yardımcı olan benzersiz bir ayarı Ocr.Configuration.ReadBarCodes vardır; varsıyılan değer false olarak ayarlanmistir.
Girdiyi okuduktan sonra, veri OCRResult adlı nesneye kaydedilecektir; Bu, tüm mevcut barkod verilerini bir listeye toplayan Barcodes adlı bir özelliğe sahiptir. foreach döngüsünü kullanarak, tüm barkod detaylarını tek tek elde edebiliriz. Ayrica barkodu tarar ve barkod degerini okur — iki işlem tek bir süreçte tamamlanir!
Ek olarak, çoklu OCR süreçlerini ayni anda yürütme olanagini saglayan is parcasi ayarlari da desteklenmektedir. IronOCR ayni zamanda belirli bir bölgeden belirli bir alan tanima yetenegine de sahiptir.
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Create OcrInput to manage input images
using (var Input = new OcrInput())
{
// Define a specific rectangular area on the image for OCR
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Add an image specifying the area to be processed
Input.Add("document.png", ContentArea);
// Perform OCR to read text from the specified area
var Result = Ocr.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
}
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();
// Create OcrInput to manage input images
using (var Input = new OcrInput())
{
// Define a specific rectangular area on the image for OCR
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Add an image specifying the area to be processed
Input.Add("document.png", ContentArea);
// Perform OCR to read text from the specified area
var Result = Ocr.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
}
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()
' Create OcrInput to manage input images
Using Input = New OcrInput()
' Define a specific rectangular area on the image for OCR
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' Add an image specifying the area to be processed
Input.Add("document.png", ContentArea)
' Perform OCR to read text from the specified area
Dim Result = Ocr.Read(Input)
' Output the extracted text to the console
Console.WriteLine(Result.Text)
End Using
Yukaridaki örnek kod, belirli bir bölgede OCR uygulamasi kapsamaktadir. Yalnizca görüntü veya PDF üzerindeki dikdörtgen alanı belirtmemiz yetecektir — IronOCR içindeki Tesseract motoru, metnin taninmasini saglar.
7. Sonuç
.NET Framework ortaminda IronOCR kullanirken, Tesseract kullanim kolayligi sunar. Çesitli sekillerde fotoğraf ve PDF belgelerini destekler. Tesseract OCR kutuphanelerinin performansini geliştirecek ayarlar sunar. Çok sayida dil desteklenmektedir, tek bir işlemde birçok dili içerir. Tesseract OCR hakkinda daha fazla bilgi edinmek için web sitelerini ziyaret edin.
ABBYY FineReader PDF, bir görüntü/PDF belgesini tanıma amaciyla yapay zeka motorunu kullanan bir yazilim uygulamasidir. Ayrıca OCR sürecinin performansını iyileştirmek için çeşitli ayarlar sunar. Ek olarak, birden fazla dili seçme seçenegi sunar. ABBYY FineReader PDF, sayfa dönüştürme kullanımı üzerinde bazı sınırlamalar içerir. Farklı işletim sistemleri için farklı fiyatlar bulunmaktadır. To know more about the ABBYY FineReader PDF price details, click here.
Testlerimizde, IronOCR, ABBYY FineReader PDF'ye kıyasla güçlü bir performans sergiledi. Bu karşılaştırmada sunulan özel test senaryolarında, düşük kaliteli görüntülerde bazı karakterler ve sayılar FineReader tarafından doğru tanınmazken, IronOCR bu özel senaryolar için daha doğru sonuçlar sağladı. IronOCR ayrıca, resimlerdeki barkod verilerini tanıma ve barkod değerlerini okuma kapasitesini de sunar. IronOCR paketi ömür boyu lisans sağlar ve devam eden maliyet yoktur. The IronOCR package supports multiple platforms at a single price. To know more about IronOCR price details, click here.
Sıkça Sorulan Sorular
IronOCR'u ABBYY FineReader'dan üstün kılan nedir?
IronOCR, dikkat çekici OCR performansı, düşük kaliteli görüntüleri işleme yeteneği ve barkodlar ile QR kodları okuma gibi kapsamlı özellikleri nedeniyle üstün olarak kabul edilir. Ayrıca, tekrar eden maliyetler olmaksızın ömür boyu lisans sunarak maliyet etkin bir seçimdir.
IronOCR düşük kaliteli görüntüleri nasıl işler?
IronOCR, düşük çözünürlüklü veya düşük kaliteli taranmış görüntülerin kalitesini artıracak gelişmiş görüntü iyileştirme özellikleri sunarak, OCR sonuçlarının doğruluğunu artırır.
IronOCR hangi platformları destekler?
IronOCR, Windows, Linux ve macOS'u içeren birden fazla platformu tek bir ömür boyu lisansla destekler.
IronOCR barkodlarda OCR işlemi yapabilir mi?
Evet, IronOCR, kütüphaneyi barkod değerlerini algılama ve çıkarma amacıyla yapılandırarak resimlerden barkod okuyabilir.
IronOCR'un çoklu iş parçacığı özelliğini kullanmanın faydaları nelerdir?
IronOCR'daki çoklu iş parçacığı özelliği, birden fazla OCR işleminin eşzamanlı olarak çalışmasına olanak tanır, bu da performansı ve işlem hızını önemli ölçüde artırır.
IronOCR hangi dilleri destekler?
IronOCR, dünya genelindeki uygulamalar için çok yönlü bir araç haline getirerek 125 farklı dilde OCR desteği sunar.
IronOCR'un lisanslaması ABBYY FineReader ile nasıl karşılaştırılır?
IronOCR, tekrar eden maliyetler olmaksızın ömür boyu lisans sunarken, ABBYY FineReader'ın fiyatlandırması işletim sistemine göre değişebilir ve devam eden ücretler içerebilir.
IronOCR'u C# projemde nasıl entegre edebilirim?
IronOCR'u proje için Visual Studio, Visual Studio Komut Satırı kullanarak ya da NuGet web sitesinden indirerek C# projenize entegre edebilirsiniz.
IronOCR kullanarak hangi dosya formatları dönüştürülebilir?
IronOCR, Microsoft Word, Excel ve aranabilir PDF'ler dahil olmak üzere resimler ve PDF'leri çeşitli düzenlenebilir formatlara dönüştürebilir.
IronOCR'un QR kodlarını okumak için tercih edilmesinin nedeni nedir?
IronOCR, geniş bir resim formatı ve kalite seviyesi aralığını işleme yeteneği içeren özellik seti ve yüksek doğruluğu nedeniyle QR kodlarını okumak için tercih edilir.



