IronOCR ile Asprise OCR Arasında Bir Karşılaştırma
OCR'dan bahsettigimizde, bu optik karakter tanima anlamina gelir. Is dunyasinda sikca kullanilan bir terim olan OCR, bilgisayar yazilimi araciligiyla görüntü veya metin tabanli bir belgenin (ornegin, taranmis veya fakslanmis bir sayfa gibi) bir kelime veya metin arama yapilabilir belge formatina dönüştürme işlemine atif yapar.
OCR kisaltmasi, özellikle bu amac icin tasarlanmis bir bilgisayar yazilim tarafindan gerceklestirilen optik karakter tanima anlamina gelir. Bu tur yazilim, sayfayi tarayarak herhangi bir metinsel bilgiyi tanir ve o bilgiyi dijital bir forma cevirir, boylece bu bilgi dijitally olarak dgisrtilir ve yeniden uretilir, hicbir kalite kaybi olmadan.
OCR icin bircok uygulama vardir, ama en popüler kullanım durumu taranan belgeleri, veritabanlarına formatlamak ve indekslemek ve analiz etmek icin kullanilan dijital dosyalara dönüştürmektir.
Bu makalede, OCR ve PDF belgesi görüntüleri icin en yaygin iki kutuphane ve uygulamayi karsilastiracagiz. Bunlar su sekildedir:
- Asprise OCR
- IronOCR
1.0 Giris
1.1 Asprise OCR Giris ve Özellikler
Asprise C# .NET OCR (optik karakter tanima) ve barkod tanima SDK'si, taranmis belgelerden metin ve barkod bilgisi cikarma işlemi fonksiyonunu C# .NET uygulamalari (Windows uygulamalari, Silverlight, ASP.NET web servis uygulamalari, ActiveX kontrolleri, vb.) ile donatmaniz icin yuksek performansli bir API kutuphane sunar.
Görüntüleri (JPEG, PNG, TIFF, PDF, vb. gibi çeşitli formatlarda) duzenlenebilir belge formatlari (Word, XML, aranabilir PDF, vb.) olarak dönüştürebilirsiniz. Asprise Image Scanning SDK gibi, tarayicilardan belgeleri yakalayan baska teklifler ile beraber, tam bir belge yonetim cozumunu kolayca uygulayabilirsiniz.
Asprise OCR'ın Özellikleri
Dogruluklu Metin Tanima Gelişmiş görüntü işleme ve metin tespit algoritmalariyla Asprise OCR, zayif görüntü kalitesine sahip zor belgeleri kolayca tanimali. Parametreler, hizdan biraz feragat ederek dogrulugu artırmak icin kullanilabilir.
Yuksek Hizli OCR Motoru Asprise OCR optimize edilmis bir OCR motoru kullanarak, kisitli zamanda mükemmel tanima gerceklestirir. Coklu is parcacigi kullanimi ve opsiyonel GPU ivmelendirmesi ile hiz daha da artirilabilir.
20+'dan Fazla Dil Destekli Asprise OCR, Ingilizce, Ispanyolca, Fransizca, Almanca, Italyanca, Macarca, Fince, Isvecce, Romence, Lehce, Malayca, Arapca, Endonezce ve Rusca gibi 20+'dan fazla dili tanir.
Populer Tüm Barkod Formatlari Tüm populer barkod formatlari destelenmektedir: EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Interleaved 2 of 5, Code 39, Code 128, PDF417, ve QR Code.
Görüntülerden Aranabilir PDF'e Birkaç satırlık kod ile JPEG, PNG, TIFF ve PDF gibi çeşitli formatlardaki görüntüleri aranabilir PDF dosyalarina dönüştürebilirsiniz.
Kolay Dağıtım Yazılım koruma dizisi gerektirmez, lisans sunucusu gerekmez. Asprise OCR SDK'sinin dağıtimi, onunla geliştirmek kadar kolaydir.
Butce-Dostu, Telif-Ücretsiz Telif-ücretsiz, geliştirme lisansi siparisi verirken odersiniz, ama yaziliminizi binlerce sunucuya veya binlerce son kullaniciya kurarken tekrar odeme yapmaniz gerekmez.
Odul Kazanan Destek Ekipleri sadece dostça değil, ayni zamanda size birinci sınıf teknik destek saglayabilecek durumda.
1.2 IronOCR — Giriş ve Özellikler
IronOCR, .NET uygulamaları ve web sitelerinde fotoğraflardan ve PDF'lerden metin içeriğini okumak için IronOCR for .NET kullanan mühendisler için yazılım sağlar. Dünyanin dört bir yanındaki dilleri destekleyerek fotoğraflardaki metin ve barkodlar tarar; sonrasında çıktıyı ya düzyazı metin ya da yapılandırılmış veri olarak sağlayabilir. Iron Software'in OCR kütüphanesi MVC, Web, konsol ve masaüstü .NET uygulamalarında kullanılabilir. Ticari dağıtımlar için, geliştirme ekibinden doğrudan yardım ile lisans sağlanır.
- En son Tesseract 5 motorunu kullanarak, IronOCR herhangi bir resim veya PDF formatından metin, barkodlar ve QR kodları okur. Bu kütüphane hızlı bir şekilde masaüstü, konsol ve web uygulamalarına OCR ekler.
- IronOCR, 125 uluslararası dili destekler. Ayrıca özel dil ve kelime listelerini de destekler.
- IronOCR, 20'den fazla barkod formatını ve QR kodlarını okuyabilir.
- IronOCR, çok sayfalı GIF ve TIFF görüntü formatlarini destekler.
- IronOCR, düşük kaliteli taranmış görüntüler için düzeltme sağlar.
- IronOCR çok iş parçacığını destekler — bir veya daha fazla işlemi aynı anda yürütür.
- IronOCR, sayfalar, paragraflar, satırlar, kelimeler, karakterler vb. için yapılandırılmış veri çıktısı sağlayabilir.
- IronOCR, Windows, Linux, macOS gibi çeşitli işletim sistemlerini destekler.
2.0 Visual Studio'da Yeni Proje Oluşturma
Visual Studio yazılımını açın ve "dosya menüsü"ne gidin. "yeni proje"yi seçin, ardından "Konsol Uygulaması"nı seçin.
Proje adını girin ve ilgili metin kutusunda dosya yolunu seçin. Ardından, yarat butonuna tıklayın ve aşağıdaki ekran görüntüsündeki gibi gerekli .NET Framework'ü seçin.
Visual Studio projesi, seçilen uygulama için artık yapıyı oluşturacak ve eğer konsol, Windows ve web uygulamasını seçtiyseniz, kodu girebileceğiniz ve uygulamayı derleyip çalıştırabileceğiniz Program.cs dosyasını açacak.
Sonraki adımda, kodu test etmek için kutuphaneyi ekleyebiliriz.
3.0 Kurulum
3.1 Asprise OCR Kurulumu
We can download the Asprise OCR here.
There are two options: install using NuGet or manually download the SDK from asprise.com.
Seçenek 1: NuGet PM> Install-Package asprise-ocr-api
Once yeni bir Visual C#/Visual Basic Windows Form Application projesi oluşturun veya mevcut bir projeyi kullanin. With this solution opened, open the NuGet Package Manager Console and type the following command:
Install-Package asprise-ocr-api
Bu işlem tamamlandığında, aşağıdaki kodu Program.cs içerisine kopyalayarak OCR demo Formunu çağırabilirsiniz (C# için):
using System;
using System.Windows.Forms;
using asprise_ocr_api;
static class Program
{
// Main application entry point
[STAThread]
static void Main()
{
// Enable visual styles and set text rendering mode
Application.EnableVisualStyles();
Application.SetCompatibleTextRenderingDefault(false);
// Launch the OCR sample form
Application.Run(new asprise_ocr_api.OcrSampleForm());
}
}
using System;
using System.Windows.Forms;
using asprise_ocr_api;
static class Program
{
// Main application entry point
[STAThread]
static void Main()
{
// Enable visual styles and set text rendering mode
Application.EnableVisualStyles();
Application.SetCompatibleTextRenderingDefault(false);
// Launch the OCR sample form
Application.Run(new asprise_ocr_api.OcrSampleForm());
}
}
Imports System
Imports System.Windows.Forms
Imports asprise_ocr_api
Friend Module Program
' Main application entry point
<STAThread>
Sub Main()
' Enable visual styles and set text rendering mode
Application.EnableVisualStyles()
Application.SetCompatibleTextRenderingDefault(False)
' Launch the OCR sample form
Application.Run(New asprise_ocr_api.OcrSampleForm())
End Sub
End Module
Seçenek 2: Asprise.com'dan OCR SDK İndirin
Download a copy of the Asprise OCR SDK from www.asprise.com/product/ocr. Sadece boş bir klasöre açın.
Asprise OCR SDK dağıtiminin dosya organizasyonu asagidaki gibidir:
OCR SDK
|--- aocr.dll, aocr_x64.dll [gereken DLL]
|--- örnek-projeler [.NET API ve örnek proje]
+--- görüntüler [Örnek görüntüler]
sample-projects klasörüne gidin ve çözümü açın: ocr-samples-vs.sln. Iki proje vardır:
- asprise-ocr-api: .NET OCR API
- asprise-ocr-api-sample: demo programi
asprise-ocr-api-sample projesine sağ tıklayın ve 'Başlangıç Projesi Olarak Ayarla' seçeneğini seçin, ardından 'Başlat' butonuna tıklayın veya F5 tuşuna basın; gösterildiği gibi aynı UI'yi göreceksiniz.
3.2 IronOCR'yi Kur
IronOCR Library dört farklı şekilde indirilebilir ve kurulabilir.
Bunlar su sekildedir:
- Visual Studio Kullanımı
- Visual Studio Komut Satırı Kullanımı
- NuGet web sitesinden doğrudan indirme
- IronPDF web sitesinden doğrudan indirme
3.2.1 Visual Studio Kullanarak
Visual Studio yazılımı, paketi doğrudan çözümleme üzerine yüklemek için NuGet Paket Yöneticisi seçeneğini sunar. Aşağıdaki ekran görüntüsü, NuGet Paket Yöneticisini nasıl açacağınızı gösterir.
NuGet web sitesinden paket listesini göstermek için bir arama kutusu sağlar. Paket yöneticisinde, aşağıdaki ekran görüntüsünde olduğu gibi IronOCR anahtar kelimesini aramamız gerekecek:
Yukarıdaki resimden, ilgili arama öğelerinin listesini alacağız. Paketi çözümünüze yüklemek için gerekli olan seçeneği seçmemiz gerekir.
3.2.2 Visual Studio Komut Satırı Kullanarak
Visual Studio'da Araçlar -> NuGet Paket Yöneticisi -> Paket Yöneticisi Konsolu'na gidin.
Paket Yöneticisi Konsolu sekmesine aşağıdaki satırı girin:
Install-Package IronOcr
Sonraki, paket mevcut projeye indirilecek/kurulacak ve kulanıma hazır olacaktır.
3.2.3 NuGet web sitesinden doğrudan indirme
Üçüncü yol, NuGet paketini doğrudan web sitesinden indirmektir.
- Navigate to the Link.
- Sağ taraftaki menüden indirme paketi seçeneğini seçin.
- İndirilen paketi çift tıklayın. Otomatik olarak yüklenecektir.
- Ardından, çözümü yeniden yükleyin ve projede kullanmaya başlayın.
3.2.4 IronOCR web sitesinden doğrudan indirme
Click the link here to download the latest package direct from the website. Once downloaded, follow the steps below to add the package to the project.
- Çözüm penceresinden projeyi sağ tıklayın.
- Ardından, referans seçeneğini seçin ve indirilen referansın konumuna göz atın.
- Ardından, başvuruyu eklemek için Tamam'a tıklayın.
4.0 OCR Görüntü
Hem IronOCR hem de Asprise OCR, görüntüleri metin aramaya dönüştürecek OCR teknolojisine sahiptir.
4.1 Asprise Kullanimi
Asprise OCR'nin temel kullanımını gösteren aşağıdaki kod:
using System;
using asprise_ocr_api;
class Example
{
static void Main()
{
// Set up OCR engine
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
// Recognize text from the given image
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1,
AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
// Output the recognized text to the console
Console.WriteLine("OCR Result: " + s);
// Stop the OCR engine
ocr.StopEngine();
}
}
using System;
using asprise_ocr_api;
class Example
{
static void Main()
{
// Set up OCR engine
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
// Recognize text from the given image
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1,
AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
// Output the recognized text to the console
Console.WriteLine("OCR Result: " + s);
// Stop the OCR engine
ocr.StopEngine();
}
}
Imports System
Imports asprise_ocr_api
Friend Class Example
Shared Sub Main()
' Set up OCR engine
AspriseOCR.SetUp()
Dim ocr As New AspriseOCR()
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST)
' Recognize text from the given image
Dim s As String = ocr.Recognize("C:\path\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT)
' Output the recognized text to the console
Console.WriteLine("OCR Result: " & s)
' Stop the OCR engine
ocr.StopEngine()
End Sub
End Class
Asprise OCR aşağıdaki görüntü formatlarını destekler: GIF, PNG, JPEG, TIFF ve PDF. Yukarıdaki bölümdeki örnek OCR kodu için giriş aşağıdaki gibidir:
OCR çıktısı Düz Metin Formatında olacak:
Asprise OCR ve Barkod Tanıma
Windows'da yüksek performanslı, telif ücreti olmayan OCR ve barkod tanıma,
...
ISBN-13, Birleştirilmiş 2 of 5, Kod 39, Kod 128, PDF417 ve QR Kodu.
[[QR-Code: www.asprise.com]]
[[CODE-128: Asprise]].
Son iki satır barkod bilgileri çıkarımını temsil eder. Not: hem barkodun formatı hem de içeriği '[[ ]]' çiftleri içinde yer almaktadır.
4.2 IronOCR Kullanarak
using System;
using IronOcr;
class Example
{
static void Main()
{
// Create an instance of IronTesseract
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
// Specify to use Tesseract 5 engine
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
// Create OcrInput to hold the images
using (var Input = new OcrInput())
{
// Add an image to the OcrInput
Input.AddImage(@"3.png");
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Output the recognized text to the console
Console.WriteLine(Result.Text);
Console.ReadKey();
}
}
}
using System;
using IronOcr;
class Example
{
static void Main()
{
// Create an instance of IronTesseract
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
// Specify to use Tesseract 5 engine
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
// Create OcrInput to hold the images
using (var Input = new OcrInput())
{
// Add an image to the OcrInput
Input.AddImage(@"3.png");
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Output the recognized text to the console
Console.WriteLine(Result.Text);
Console.ReadKey();
}
}
}
Imports System
Imports IronOcr
Friend Class Example
Shared Sub Main()
' Create an instance of IronTesseract
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.EnglishBest
' Specify to use Tesseract 5 engine
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
' Create OcrInput to hold the images
Using Input = New OcrInput()
' Add an image to the OcrInput
Input.AddImage("3.png")
' Perform OCR on the input image
Dim Result = Ocr.Read(Input)
' Output the recognized text to the console
Console.WriteLine(Result.Text)
Console.ReadKey()
End Using
End Sub
End Class
Yukarıda, resim dosyalarını metne dönüştürmemize olanak tanıyan Tesseract 5 API'si gösterilmektedir. Yukarıdaki kod satırında Iron Tesseract için bir nesne oluşturuyoruz. Ayrıca, bir veya daha fazla resim dosyası eklememize izin verecek bir OcrInput nesnesi yapıyoruz. Kullanırken kodun içine mevcut resim yolunu vermemiz gerekebilir. OcrInput nesne yöntemi ekleyin. Herhangi bir sayıda görüntü eklenebilir. Daha önce oluşturduğumuz IronTesseract Nesnesindeki Read işlevi, resim dosyasını ayrıştırarak ve sonucu OCR sonucuna çıkararak resimleri almak için kullanılabilir. Fotoğraflardan metin çıkarıp onu bir dizeye dönüştürme yeteneğine sahiptir.
Çoklu çerçeve görüntüleri eklemek için Tesseract'ı da kullanabiliriz. "AddMultiFrameTiff" bu işlem için farklı bir methodtir. Tesseract kütüphanesi görüntüdeki her çerçeveyi okur ve her çerçeve ayrı bir sayfa olarak muamele görür. İşlem resmin ilk karesini okuyacak ve ardından bir sonraki kareye geçecek ve böylece tüm resim kareleri taranana kadar devam edecektir. Bu yöntem yalnızca TIFF resim formatını desteklemektedir.
Yukarıdaki resim, IronOCR sonucunun çıktısıdır ve veriyi doğru bir şekilde düzenlenebilir metine dönüştürmüştür.
5.0 OCR PDF Dosyaları
IronOCR ve Asprise OCR, PDF dosyalarını düzenlenebilir metne dönüştürür. Asprise OCR, kullanıcıya sayfayı kaydetmek, resmi düzenlemek, sayfayı tanımak gibi seçenekler sunar. Ayrıca metin, belge, HTML formatı gibi seçenekler sunar. IronOCR de dönüştürülmüş OCR dosyasını HTML, metin, PDF gibi formatlarda kaydetmemize olanak tanır.
5.1 Asprise OCR Kullanarak
Çıktı formatını OUTPUT_FORMAT_PDF olarak ayarlarsanız, hedef PDF çıktı dosyasını şu şekilde belirtmeniz gerekir:
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
"PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
"PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true")
Yukarıdaki kodda, özellikler arasına yerleştirilmiş tek bir dizgi içinde belirtilmiştir|(anahtar ve değer arasinda = ile ayrilmis). Alternatif olarak, özellikleri çiftler halinde ayrı ayrı belirtebilirsiniz:
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf", AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, True)
Metni görünmez veya şeffaf yapmak için, sadece PROP_PDF_OUTPUT_TEXT_VISIBLE'yi "yanlış" olarak ayarlayın. Hem normal PDF hem de PDF/A desteklenmektedir. Asprise OCR Özellik Özeti'ne bakınız. Çıktı formatını OUTPUT_FORMAT_RTF olarak ayarlayın. Buna benzer: .rtf dosyalarını çıktılayabilirsiniz ve bunları çoğu kelime işlemcisinde (Microsoft Word, Libre Office, TextEdit vb.) düzenleyebilirsiniz.
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
"PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
"PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF, "PROP_RTF_OUTPUT_FILE=ocr-result.rtf")
OCR tamamlandıktan sonra, bir kelime işlemcisiyle RTF dosyasini görebilir veya düzenleyebilirsiniz:
Aşağıdaki yöntemle bir PDF giriş dosyasında OCR gerçekleştirebilirsiniz:
5.2 IronOCR Kullanarak
OCRInput'u PDF dosyalarını yönetmek için de kullanabiliriz. Belgelerin her sayfası, Iron Tesseract sınıfı tarafından okunacaktır. Metin daha sonra sayfalardan çikarilacak. Korunmuş belgeleri açmamızı sağlayan ve listemize PDF eklememizi sağlayan ikinci bir işlev olan AddPdf kullanarak da korumalı belgeleri açabiliriz (eğer korumalıysa şifre). Asagidaki kod, sifre korumali bir PDF belgesinin nasıl açilacagini gösteriyor:
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add a password protected PDF
Input.AddPdf("example.pdf", "password");
// Read the PDF document
var Result = Ocr.Read(Input);
// Output the recognized text to the console
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add a password protected PDF
Input.AddPdf("example.pdf", "password");
// Read the PDF document
var Result = Ocr.Read(Input);
// Output the recognized text to the console
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
' Add a password protected PDF
Input.AddPdf("example.pdf", "password")
' Read the PDF document
Dim Result = Ocr.Read(Input)
' Output the recognized text to the console
Console.WriteLine(Result.Text)
End Using
AddpdfPage kullanarak bir PDF belgesindeki tek bir sayfadan içerik okuyabilir ve çıkarabiliriz. Metni çıkarmak istediğimiz sayfa numarasını yalnızca belirtmeniz gerekiyor. AddPdfPage metni belirttiğimiz birçok sayfadan çıkarmamızı sağlar. IEnumerable<int> içinde, birden fazla sayfayı kolayca belirleyebiliriz. Ayrica dosya konumunu ve dosyanin uzantisini da eklememiz gerekiyor. Bu, asagidaki kod örneginde gösterilmektedir:
using IronOcr;
using System.Collections.Generic;
IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Extract single page
Input.AddPdfPage("example.pdf", 10);
// Extract multiple pages
Input.AddPdfPages("example.pdf", numbers);
// Read the pages and extract content
var Result = Ocr.Read(Input);
// Output the recognized text and save to a text file
Console.WriteLine(Result.Text);
Result.SaveAsTextFile("ocrtext.txt");
}
using IronOcr;
using System.Collections.Generic;
IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Extract single page
Input.AddPdfPage("example.pdf", 10);
// Extract multiple pages
Input.AddPdfPages("example.pdf", numbers);
// Read the pages and extract content
var Result = Ocr.Read(Input);
// Output the recognized text and save to a text file
Console.WriteLine(Result.Text);
Result.SaveAsTextFile("ocrtext.txt");
}
Imports IronOcr
Imports System.Collections.Generic
Private numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
' Extract single page
Input.AddPdfPage("example.pdf", 10)
' Extract multiple pages
Input.AddPdfPages("example.pdf", numbers)
' Read the pages and extract content
Dim Result = Ocr.Read(Input)
' Output the recognized text and save to a text file
Console.WriteLine(Result.Text)
Result.SaveAsTextFile("ocrtext.txt")
End Using
SaveAsTextFile işlevini kullanarak, sonucu bir metin dosyası olarak depolayabiliriz, bu da dosyayı çıkış dizin yolu indirilebilir hale getirir. Ayrıca, dosyayı SaveAsHocrFile kullanarak bir HTML dosyasına kaydedebiliriz.
6.0 Diğer Özellikler
6.1 Asprise OCR Kullananlar İçin
Asprise OCR'nin Ek Seçenekleri var, örneğin: Metin Alanını Çiz, Resim Alanını Çiz, Tablo Alanını Çiz, Tanıma Alanını Çiz vb. Bu seçenekler kullanıcının OCR'nin performansını artırmasına yardımcı olur. Başvuru yalnızca OCR gerçekleştirmekle kalmaz, aynı zamanda PDF'leri birleştirme, PDF'leri bölme, PDF'leri düzenleme gibi işlemleri de yapabiliriz.
6.2 IronOCR Kullanimi
IronOCR, taranmis belgelerden barkod ve QR kodlarini okumamizi saglayan benzersiz özelliklere sahiptir. Aşağıdaki kodlar, verilen bir görüntü veya belgeden bir barkod nasıl okunacağını gösterir.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
// Add an image containing a barcode
Input.AddImage("barcode.gif");
// Read the image to recognize text and barcodes
var Result = Ocr.Read(Input);
// Loop through barcodes and output the value
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
}
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
// Add an image containing a barcode
Input.AddImage("barcode.gif");
// Read the image to recognize text and barcodes
var Result = Ocr.Read(Input);
// Loop through barcodes and output the value
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
}
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
' Add an image containing a barcode
Input.AddImage("barcode.gif")
' Read the image to recognize text and barcodes
Dim Result = Ocr.Read(Input)
' Loop through barcodes and output the value
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
Next Barcode
End Using
Yukarıda, verilen bir görüntü veya PDF belgesinden bir barkod okumaya yardımcı olan kod bulunmaktadır. Bir sayfa/görüntüden birden fazla barkod okuyabilir. Bir barkod okumak için, IronOCR'un Ocr.Configuration.ReadBarCodes adlı benzersiz bir ayarı vardır, bu da barkod okumaya yardımcı olur. Varsayılan olarak değer false olarak ayarlanmıştır.
Girdiyi okuduktan sonra, veriler OCRResult adlı nesneye kaydedilecektir. Bu, Barkodlar adı verilen bir özelliğe sahiptir ve mevcut tüm barkod verileri bir listede olacaktır. for-each döngüsü kullanarak, tüm barkod ayrıntılarını birer birer elde edebiliriz. Ayrıca, barkodu tarayacak ve barkodun değerini okuyacak, bu iki işlem tek bir süreçte tamamlanır.
Ayrıca iplik seçeneklerini destekler. Birden fazla OCR işlemini aynı anda gerçekleştirebiliriz. IronOCR ayrıca belirli bir bölgeden belirli bir alanı tanıyabilir.
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Define the area to recognize text
var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Add the document with the specified content area
Input.Add("document.png", ContentArea);
// Perform OCR on the specified region
var Result = Ocr.Read(Input);
// Output the recognized text to the console
Console.WriteLine(Result.Text);
}
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Define the area to recognize text
var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Add the document with the specified content area
Input.Add("document.png", ContentArea);
// Perform OCR on the specified region
var Result = Ocr.Read(Input);
// Output the recognized text to the console
Console.WriteLine(Result.Text);
}
Imports IronOcr
Imports System.Drawing
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
' Define the area to recognize text
Dim ContentArea = New Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' Add the document with the specified content area
Input.Add("document.png", ContentArea)
' Perform OCR on the specified region
Dim Result = Ocr.Read(Input)
' Output the recognized text to the console
Console.WriteLine(Result.Text)
End Using
Yukarıdaki, belirli bir bölgede OCR gerçekleştirmek için örnek bir koddur. Yalnızca görüntüdeki veya PDF'teki dikdörtgen bölgeyi belirtmemiz gerekir. IronOCR'deki Tesseract motoru, metni tanımamıza yardımcı olur.
7.0 IronOCR ve Asprise OCR Lisans Modelleri ve Fiyatlandırma
IronOCR Lisans Modelleri ve Fiyatları
30 günlük para iade garantisi: lisans satın alındığında, lisans çalışmazsa 30 gün içinde para iadesi alırsınız.
Kolay entegrasyon: IronOCR'nin bir proje ve çevre ile entegrasyonu o kadar kolaydır ki sadece bir satır kod yazarak ve NuGet Paketinden ekleyerek yapabiliriz. Veya, onu web'den indirip ortamımızla bu şekilde entegre edebiliriz.
Süresiz Lisanslama: Her lisans bir defa satın alınır ve yenileme gerektirmez.
Ücretsiz Destek ve Ürün Güncellemeleri: her lisansla bir yıl ücretsiz ürün güncellemeleri ve ürünün arkasındaki takımdan destek gelir. Herhangi bir zamanda eklentiler satın almak mümkündür. Eklentiler görüntülenebilir.
Anında Lisanslar: Kaydedilmiş lisans anahtarları ödeme alındığında hemen gönderilir.
Tüm lisanslar süresizdir ve geliştirme, sahneleme ve üretimi kapsar.
Lite Lisans:
- 1 geliştirici
- 1 konum
- 1 proje
- Süresiz lisans
Bu paket, bir kurumdaki tek bir yazılım geliştiricisine, Iron Software'i tek bir yerde kullanma izni verir. Iron Software, tek bir web uygulamasında, intranet uygulamasında veya masaüstü yazılım programında kullanılabilir. Lisanslar devredilemez ve bir organizasyon veya bir ajans/müşteri ilişkisi dışında paylaşılamazlar. Bu lisans türü, diğer tüm lisans türleri gibi, Sözleşme kapsamında açıkça verilmediği sürece başka hiçbir hakkı kapsamaz, OEM yeniden dağıtım olmadan ve Iron Software'i SaaS olarak kullanmadan önce daha fazla kapsam almanız gerekmeden.
Fiyatlandırma: Yılda $799 ile başlar.
Profesyonel Lisans:
- 10 geliştirici
- 10 konum
- 10 proje
- Süresiz lisans
Bu paket, bir organizasyondaki önceden belirlenmiş sayıda yazılım geliştiricisine, Iron Software'i tek yerlerde ve en fazla on kişiye kadar kullanma izni verir. Iron Software, istediğiniz kadar web sitesinde, intranet uygulamalarinda veya masaüstü yazilim uygulamalarinda kullanilabilir. Lisanslar devredilemez ve kurulus veya ajans/müsteri iliskisi disinda paylasilamaz. Bu lisans türü, diğer lisans türleri gibi, İçesinde belirtilmeyen diğer hakları hariç tutar, OEM dağitimi ve ek kapsam satin alinmadikça Iron Software'i SaaS olarak kullanma dahil. Bu lisans, maksimum 10'a kadar tek bir proje ile entegre edilebilir.
Fiyatlandirma: Yillik $999'dan başlar.
Sınırsız Lisans:
- Sınırsız geliştirici
- Sınırsız konum
- Sınırsız proje
- Süresiz lisans
Bu, bir kurulusun sinirsiz sayida yazilim geliştiricisinin sinirsiz sayida konumda Iron Software'i kullanmasina olanak tanir. Iron Software, istediğiniz kadar web sitesinde, intranet uygulamalarinda veya masaüstü yazilim uygulamalarinda kullanilabilir. Lisanslar devredilemez ve kurulus veya ajans/müsteri iliskisi disinda paylasilamaz. Bu lisans türü, diğer lisans türleri gibi, İçesinde belirtilmeyen diğer hakları hariç tutar, OEM dağitimi ve ek kapsam satin alinmadikça Iron Software'i SaaS olarak kullanma dahil.
Fiyatlandirma: Yillik $2,999'dan başlar.
Telif-Ücretsiz Yeniden Dağıtim: Bu, temel lisans kapsamındaki projelerin sayısına dayalı olarak Iron Software'i farklı paketlenmiş ticari ürünlerin bir parçası olarak telif ödemeden dağıtmaniza olanak tanir. Bu, Iron Software'in, temel lisans kapsamindaki projelerin sayisina gore SaaS yazilim hizmetleri icinde yayilmasina olanak tanir.
Fiyatlandirma: Yillik $1,599'dan başlar.
Asprise OCR Lisans Modelleri ve Fiyatlandırma
Lite Lisans:
- Sınırsız son kullanıcılar
- Metni tanı
- 1D barkodlar oku: UPC, EAN, Code39, Code128
- Metin, XML ve PDF çıktısı
- Kolay dağıtım
- Sadece 2 işletim sistemi destekler
- 1 koltuk
- Destek: Hayır
Fiyatlandırma: Yılda $7998 ile başlar.
Standart Lisans:
- Sınırsız son kullanıcılar
- BMP, GIF, PNG, JPEG, TIFF ve PDF girişi.
- Metni tanı
- 1D barkodlar oku: UPC, EAN, Code39, Code128
- Bazı 2D'leri oku: QR ve Data Matrix sadece
- Metin, XML ve PDF çıktısı
- Kolay dağıtım
- Destek: Hayır
Fiyatlandırma: Yılda $7,998 den başlar.
Kurumsal Lisans:
- Sınırsız son kullanıcılar
- BMP, GIF, PNG, JPEG, TIFF ve PDF girişi.
- Metni tanı
- 1D barkodlar oku: UPC, EAN, Code39, Code128
- 2D: QR, PDF 417, Veri Matrisi ve Aztek
- Metin, XML ve PDF çıktısı
- Kolay dağıtım
- Çoklu iş parçacığı, çoklu işleme
Fiyatlandırma: $12,998 den başlar.
IronOCR Lite bir yıllık destekle tek geliştirici paketi dahilinde yaklaşık $799'a mal olurken, Asprise Lite tek geliştirici paketi desteksiz olarak $7998, ve $6,296 ücretli teknik destekle. IronOCR'nin Profesyonel lisansı dahil edilen 10 geliştirici paketi ve bir yıl teknik destek maliyeti $999, ancak eşdeğer Asprise lisansı 10 geliştirici paketi ile teknik destek olmadan yıllık $37,998, ancak ücretli teknik sürümler ve güncellemeler, artı bir yıllık destekle $46,999.00
IronOCR Lite ve Professional paketleri SaaS hizmet veya OEM ve 5 yillik destek seçeneği icerir. Lite versiyonu dahil, bir geliştirici paketi ve 5 yıllık destek ve SaaS ve OEM hizmeti $2897USD, Asprise'in bir SaaS veya OEM hizmeti ve özel bir destek seçeneği vardır. IronOCR'nin Profesyonel versiyonu 10 geliştirici paketi dahil, bir yıllık ücretli destek ve SaaS ve OEM hizmeti maliyeti $3397, Asprise versiyonu ise 10 geliştirici paketi ile 1 yıllık destek olmadan ve SaaS ve OEM hizmeti ile $59,996 maliyet.
8.0 Sonuç
.NET Framework bağlamında IronOCR, doğrudan ve kullanımı kolay bir Tesseract sağlar. Çesitli sekillerde fotoğraf ve PDF belgelerini destekler. Tesseract OCR kutuphanelerinin performansini geliştirecek ayarlar sunar. Çok sayida dil desteklenmektedir, tek bir işlemde birçok dili içerir. Tesseract OCR hakkinda daha fazla bilgi edinmek için web sitelerini ziyaret edin.
Asprise, yapay zeka motoru kullanarak görüntüleri ve PDF belgelerini tanıyan bir yazılım uygulamasıdır. Ayrıca OCR sürecinin performansını iyileştirmek için çeşitli ayarlar sunar. Ek olarak, birden fazla dili seçme seçenegi sunar. Asprise'in sayfa dönüştürme kullanımında bazı sınırlamaları vardır. Farkli isletim sistemleri icin farkli fiyatlara sahiptir.
IronOCR paketleri, Asprise'e kıyasla daha iyi lisanslama ve destek sağlar. Asprise OCR, daha pahalı olan özelleştirilmiş ve sabit paketlere sahiptir. IronOCR $799 ile başlarken, Asprise OCR yılda $7994 ile başlar, bu nedenle ürünümüz daha fazla özellik sunarken aynı zamanda daha maliyet-etkindir. Ayrıca tek bir fiyata birden fazla platformu destekler.
O hâlde, neyi bekliyorsunuz? Ücretsiz deneme herkese açıktır. You can obtain the License here and begin straightaway.
Sıkça Sorulan Sorular
Optik karakter tanıma nedir?
Optik karakter tanıma (OCR), taranmış kağıt belgeler, PDF'ler veya dijital kamera tarafından çekilmiş görüntüler gibi farklı tipte belgeleri düzenlenebilir ve aranabilir verilere dönüştürmek için kullanılan teknolojidir. IronOCR gibi araçlar, metin görüntülerini gerçek metin verilerine dönüştürerek OCR gerçekleştirir.
C# kullanarak görüntüleri metne nasıl dönüştürebilirim?
IronOCR, C#'ta görüntüleri metne dönüştürmek için sağlam bir çözüm sunar. Tesseract 5 motorunu kullanarak düşük kaliteli görüntülerden bile metin çıkarmak için güçlü OCR yeteneklerini kullanabilirsiniz.
IronOCR, OCR işlemleri için hangi formatları destekler?
IronOCR, JPEG, PNG, GIF, BMP, TIFF ve PDF gibi geniş bir format yelpazesini OCR işlemleri için destekler. Ayrıca çok sayfalı belgeleri ve parola korumalı PDF'leri de işleyebilir.
C# projemde IronOCR'u nasıl kurarım?
IronOCR'u Visual Studio'daki NuGet Paket Yöneticisi'ni kullanarak C# projenize kurabilirsiniz. Alternatif olarak, komut satırı ile Install-Package IronOCR komutunu kullanarak veya doğrudan IronOCR web sitesinden indirebilirsiniz.
IronOCR'u diğer OCR kütüphanelerine göre kullanmanın avantajları nelerdir?
IronOCR, kapsamlı dil desteği, düşük kaliteli görüntülerle mükemmel performans ve barkod ve QR kod tanıma gibi özellikler sunar. Tek bir fiyata birden fazla platform desteği sunan ve uygun maliyetli lisanslama sağlayan bir seçenek yapar, bu da onu geliştiriciler için çok yönlü bir tercih kılar.
IronOCR çok sayfalı belgeleri işleyebilir mi?
Evet, IronOCR, TIFF ve PDF'ler dahil olmak üzere çok sayfalı belgeleri işleyebilir ve her sayfadan verimli bir şekilde metin çıkarabilir. Bu, özellikle büyük belgeleri veya toplu işlemleri yönetmek için faydalıdır.
IronOCR için hangi lisanslama seçenekleri mevcuttur?
IronOCR, Lite, Professional ve Unlimited lisansları dahil olmak üzere esnek, kalıcı lisanslama seçenekleri sunar. Bu lisanslar telif ücretsizdir ve SaaS ve OEM hizmetlerini destekler, bu da onları çeşitli dağıtım senaryoları için uygun kılar.
IronOCR, düşük kaliteli görüntülerden metin çıkarmayı nasıl ele alıyor?
IronOCR, metin tanımanın doğruluğunu önemli ölçüde artırarak, OCR gerçekleştirmeden önce görüntü kalitesini artırmak için gelişmiş ön işleme tekniklerini kullanarak düşük kaliteli görüntülerden metin çıkarmada mükemmeldir.



