Przejdź do treści stopki
PORóWNAJ Z INNYMI KOMPONENTAMI

Porównanie pomiędzy IronOCR a Asprise OCR

When we talk about OCR, it refers to optical character recognition. The term is often used in the business world to refer to the process of converting an image or graphical representation of any text-based document (e.g. a scanned or faxed page) into an editable word format or text-searchable document format by means of computer software.

The acronym OCR stands for Optical Character Recognition, a task carried out by computer software that has been designed specifically for the purpose. This type of software will scan the page and recognize any textual information that is on there, converting it into a digital form so that it can be edited and reproduced digitally with no loss in quality.

There are many applications for OCR, but the most popular use case is converting scanned documents into digital files that can be formatted and indexed in databases and analyzed.

In this article, we are going to compare two of the most common libraries and applications for OCR and PDF document images. Są to:

  • Asprise OCR
  • IronOCR

1.0 Wprowadzenie

1.1 Asprise OCR Introduction and Features

The Asprise C# .NET OCR (optical character recognition) and barcode recognition SDK offers a high-performance API library for you to equip your C# .NET applications (Windows applications, Silverlight, ASP.NET web service applications, ActiveX controls, etc.) with the functionality of extracting text and barcode information from scanned documents.

You can convert images (in various formats like JPEG, PNG, TIFF, PDF, etc.) into editable document formats (Word, XML, searchable PDF, etc.). Alongside other offerings such as the Asprise Image Scanning SDK (which captures documents from scanners), you can easily implement full document management solutions.

The Features of Asprise OCR

Accurate Text Recognition
With enhanced image processing and text detection algorithms, Asprise OCR can easily recognize difficult documents with poor image quality. Parameters can be used to slightly favor accuracy over speed.

High-Speed OCR Engine
Asprise OCR uses an optimized OCR engine to perform excellent recognition within a short time frame. Speed can be further improved through multithreading and optional GPU acceleration.

20+ Languages Supported
Asprise OCR recognizes 20+ languages such as English, Spanish, French, German, Italian, Hungarian, Finnish, Swedish, Romanian, Polish, Malay, Arabic, Indonesian, and Russian.

All Popular Barcode Formats
All popular barcode formats are supported: EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Interleaved 2 of 5, Code 39, Code 128, PDF417, and QR Code.

Images to Searchable PDF
With a few lines of code, you can convert various formats of images such as JPEG, PNG, TIFF, and PDF into searchable PDF files.

Easy Deployment
No software protection dongle, no licensing server is required. Deployment of Asprise OCR SDK is as easy as you develop with it.

Budget-Friendly, Royalty-Free
Royalty-free means you pay when you order a development license, but you don't have to pay again when you deploy your software to thousands of servers or to thousands of end-users.

Award-Winning Support
Their team is not only friendly but also capable of providing you with first-class technical support.

1.2 IronOCR — Wprowadzenie i funkcje

IronOCR provides software for engineers who use IronOCR for .NET to read text content from photos and PDFs in .NET apps and websites. It scans photos for text and barcodes and supports numerous worldwide languages; Następnie może generować dane wyjściowe w postaci zwykłego tekstu lub danych ustrukturyzowanych. Biblioteka OCR firmy Iron Software może być używana w aplikacjach .NET typu MVC, internetowych, konsolowych i desktopowych. W przypadku wdrożeń komercyjnych licencjonowanie odbywa się przy bezpośredniej pomocy zespołu programistów.

  • Korzystając z najnowszego silnika Tesseract 5, IronOCR odczytuje tekst, BARCODE i kody QR z dowolnego obrazu lub pliku w formacie PDF. Ta biblioteka szybko dodaje funkcję OCR do aplikacji desktopowych, konsolowych i internetowych.
  • IronOCR obsługuje 125 języków międzynarodowych. Obsługuje również niestandardowe listy języków i słów.
  • IronOCR potrafi odczytywać ponad 20 formatów kodów kreskowych oraz kody QR.
  • IronOCR supports multi-page GIFs and TIFF image formats.
  • IronOCR zapewnia korekcję skanów o niskiej jakości.
  • IronOCR obsługuje wielowątkowość — wykonuje jeden lub więcej procesów jednocześnie.
  • IronOCR może zapewnić wyprowadzenie danych strukturalnych dla stron, akapitów, wierszy, słów, znaków itp.
  • IronOCR obsługuje różne systemy operacyjne, takie jak Windows, Linux, macOS itp.

2.0 Creating a New Project in Visual Studio

Otwórz oprogramowanie Visual Studio i przejdź do "menu Plik". Wybierz "nowy projekt", a następnie "Aplikacja konsolowa".

Abbyy Finereader Ocr Alternatives 1 related to 2.0 Creating a New Project in Visual Studio

Wpisz nazwę projektu i wybierz ścieżkę do pliku w odpowiednim polu tekstowym. Następnie kliknij przycisk "Utwórz" i wybierz wymagańy .NET Framework, tak jak na poniższym zrzucie ekranu.

Abbyy Finereader Ocr Alternatives 2 related to 2.0 Creating a New Project in Visual Studio

The Visual Studio project will now generate the structure for the selected application, and if you have selected the console, Windows, and web application, it will now open the Program.cs file where you can enter the code and build/run the application.

Abbyy Finereader Ocr Alternatives 3 related to 2.0 Creating a New Project in Visual Studio

Następnie możemy dodać bibliotekę, aby przetestować kod.

3.0 Instalacja

3.1 Install Asprise OCR

We can download the Asprise OCR here.

There are two options: install using NuGet or manually download the SDK from asprise.com.

Option 1: NuGet PM> Install-Package asprise-ocr-api

First, create a new Visual C#/Visual Basic Windows Form Application project or use an existing project. With this solution opened, open the NuGet Package Manager Console and type the following command:

Install-Package asprise-ocr-api

Once it is done, you can invoke the OCR demo Form by copying the following code to Program.cs (for C#):

using System;
using System.Windows.Forms;
using asprise_ocr_api;

static class Program
{
    // Main application entry point
    [STAThread]
    static void Main()
    {
        // Enable visual styles and set text rendering mode
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);

        // Launch the OCR sample form
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
using System;
using System.Windows.Forms;
using asprise_ocr_api;

static class Program
{
    // Main application entry point
    [STAThread]
    static void Main()
    {
        // Enable visual styles and set text rendering mode
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);

        // Launch the OCR sample form
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
Imports System
Imports System.Windows.Forms
Imports asprise_ocr_api

Friend Module Program
	' Main application entry point
	<STAThread>
	Sub Main()
		' Enable visual styles and set text rendering mode
		Application.EnableVisualStyles()
		Application.SetCompatibleTextRenderingDefault(False)

		' Launch the OCR sample form
		Application.Run(New asprise_ocr_api.OcrSampleForm())
	End Sub
End Module
$vbLabelText   $csharpLabel

Option 2: Download the OCR SDK from Asprise.com

Download a copy of the Asprise OCR SDK from www.asprise.com/product/ocr. Simply unzip it to an empty folder.

The file organization of Asprise OCR SDK distribution is as follows:

OCR SDK
|--- aocr.dll, aocr_x64.dll [required DLL]
|--- sample-projects        [.NET API and sample project]
+--- images                 [Sample images]

Navigate to the sample-projects folder and open the solution: ocr-samples-vs.sln. There are two projects:

  • asprise-ocr-api: the .NET OCR API
  • asprise-ocr-api-sample: demo program

Right-click on the asprise-ocr-api-sample project and "Set as StartUp Project", then hit the 'Start' button or press F5 and you'll see the same UI as shown.

3.2 Zainstaluj IronOCR

Bibliotekę IronOCR można pobrać i zainstalować na cztery sposoby.

Są to:

  • Korzystanie z programu Visual Studio
  • Korzystanie z wiersza poleceń programu Visual Studio
  • Bezpośrednie pobranie ze strony NuGet
  • Bezpośrednie pobranie ze strony internetowej IronPDF

3.2.1 Korzystanie z programu Visual Studio

Oprogramowanie Visual Studio udostępnia opcję NuGet Package Manager, która pozwala zainstalować pakiet bezpośrednio w rozwiązaniu. Poniższy zrzut ekranu pokazuje, jak otworzyć menedżera pakietów NuGet.

Abbyy Finereader Ocr Alternatives 6 related to 3.2.1 Korzystanie z programu Visual Studio

Zawiera pole wyszukiwania, które wyświetla listę pakietów ze strony NuGet. W menedżerze pakietów musimy wyszukać słowo kluczowe IronOCR, tak jak na poniższym zrzucie ekranu:

Abbyy Finereader Ocr Alternatives 7 related to 3.2.1 Korzystanie z programu Visual Studio

Z powyższego obrazka uzyskamy listę powiązanych pozycji wyszukiwania. Musimy wybrać odpowiednią opcję, aby zainstalować pakiet w rozwiązaniu.

3.2.2 Korzystanie z wiersza poleceń programu Visual Studio

W programie Visual Studio przejdź do menu Narzędzia -> Menedżer pakietów NuGet -> Konsola menedżera pakietów

Wprowadź następujący wiersz w zakładce Konsola menedżera pakietów:

Install-Package IronOcr

Next, the package will download/install in the current project and be ready to use.

3.2.3 Bezpośrednie pobranie ze strony NuGet

Trzecim sposobem jest pobranie pakietu NuGet bezpośrednio ze strony internetowej.

  • Navigate to the Link.
  • Wybierz opcję pakietu do pobrania z menu po prawej stronie.
  • Kliknij dwukrotnie pobrany pakiet. Zostanie zainstalowany automatycznie.
  • Następnie przeładuj rozwiązanie i zacznij z niego korzystać w projekcie.

3.2.4 Bezpośrednie pobranie ze strony internetowej IronOCR

Click the link here to download the latest package direct from the website. Once downloaded, follow the steps below to add the package to the project.

  • Kliknij prawym przyciskiem myszy projekt w oknie rozwiązania.
  • Then, select the option reference and browse the location of the downloaded reference.
  • Następnie kliknij OK, aby dodać odwołanie.

4.0 Obraz OCR

Both IronOCR and Asprise OCR have an OCR technology that will convert images into text searching.

4.1 Using Asprise

The following code demonstrates the basic usage of Asprise OCR.

using System;
using asprise_ocr_api;

class Example
{
    static void Main()
    {
        // Set up OCR engine
        AspriseOCR.SetUp();
        AspriseOCR ocr = new AspriseOCR();
        ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);

        // Recognize text from the given image
        string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, 
            AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);

        // Output the recognized text to the console
        Console.WriteLine("OCR Result: " + s);

        // Stop the OCR engine
        ocr.StopEngine();
    }
}
using System;
using asprise_ocr_api;

class Example
{
    static void Main()
    {
        // Set up OCR engine
        AspriseOCR.SetUp();
        AspriseOCR ocr = new AspriseOCR();
        ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);

        // Recognize text from the given image
        string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, 
            AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);

        // Output the recognized text to the console
        Console.WriteLine("OCR Result: " + s);

        // Stop the OCR engine
        ocr.StopEngine();
    }
}
Imports System
Imports asprise_ocr_api

Friend Class Example
	Shared Sub Main()
		' Set up OCR engine
		AspriseOCR.SetUp()
		Dim ocr As New AspriseOCR()
		ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST)

		' Recognize text from the given image
		Dim s As String = ocr.Recognize("C:\path\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT)

		' Output the recognized text to the console
		Console.WriteLine("OCR Result: " & s)

		' Stop the OCR engine
		ocr.StopEngine()
	End Sub
End Class
$vbLabelText   $csharpLabel

Asprise OCR supports the following image formats: GIF, PNG, JPEG, TIFF, and PDF. For the sample OCR code in the above section, the input looks like the below:

Asprise Ocr Alternatives 6 related to 4.1 Using Asprise

The OCR output will be in Plain-Text Format:

Asprise OCR and Barcode Recognition

High performance, royalty-free OCR and barcode recognition on Windows,
...
ISBN-13, Interleaved 2 of 5, Code 39, Code 128, PDF417, and QR Code.

[[QR-Code: www.asprise.com]]
[[CODE-128: Asprise]].

The last two lines represent barcode information extract. Note: both the format and content of the barcode are enclosed in '[[ ]]' pairs.

4.2 Korzystanie z IronOCR

using System;
using IronOcr;

class Example
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();
        Ocr.Language = OcrLanguage.EnglishBest;

        // Specify to use Tesseract 5 engine
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Create OcrInput to hold the images
        using (var Input = new OcrInput())
        {
            // Add an image to the OcrInput
            Input.AddImage(@"3.png");

            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text to the console
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
using System;
using IronOcr;

class Example
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();
        Ocr.Language = OcrLanguage.EnglishBest;

        // Specify to use Tesseract 5 engine
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Create OcrInput to hold the images
        using (var Input = new OcrInput())
        {
            // Add an image to the OcrInput
            Input.AddImage(@"3.png");

            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text to the console
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
Imports System
Imports IronOcr

Friend Class Example
	Shared Sub Main()
		' Create an instance of IronTesseract
		Dim Ocr = New IronTesseract()
		Ocr.Language = OcrLanguage.EnglishBest

		' Specify to use Tesseract 5 engine
		Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5

		' Create OcrInput to hold the images
		Using Input = New OcrInput()
			' Add an image to the OcrInput
			Input.AddImage("3.png")

			' Perform OCR on the input image
			Dim Result = Ocr.Read(Input)

			' Output the recognized text to the console
			Console.WriteLine(Result.Text)
			Console.ReadKey()
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Powyżej przedstawiono API Tesseract 5, które pozwala nam konwertować pliki graficzne na tekst. We're making an object for Iron Tesseract in the above line of code. We're also making an OcrInput object that will allow us to add one or more picture files. We may need to give the available picture path inside the code when utilizing the OcrInput object method add. Można dodać dowolną liczbę obrazów. The function Read in the Object IronTesseract that we constructed before may be utilized to get the images by parsing the image file and extracting the result into the OCR result. Potrafi wyodrębniać tekst ze zdjęć i konwertować go na ciąg znaków.

Możemy również użyć Tesseract do dodania obrazów wieloklatkowych. "AddMultiFrameTiff" is a different method for this operation. Biblioteka Tesseract odczytuje każdą klatkę obrazu, a każda klatka jest traktowana jako oddzielna strona. Proces odczyta pierwszą klatkę obrazu, a następnie przejdzie do następnej i tak dalej, aż wszystkie klatki obrazu zostaną zeskanowane. Ta metoda obsługuje wyłącznie format obrazu TIFF.

Asprise Ocr Alternatives 7 related to 4.2 Korzystanie z IronOCR

The above image is the output of the IronOCR result, which has accurately converted the data into editable text.

5.0 Pliki PDF z OCR

IronOCR and Asprise OCR convert PDF files into editable text. Asprise OCR provides a list of options to the user such as save the page, edit the image, recognizing the page, etc. It also provides save options such as text, document, HTML format, etc. IronOCR also allows us to save the converted OCR file into HTML, text, PDF, etc.

5.1 Using Asprise OCR

If you set the output format as OUTPUT_FORMAT_PDF, you need to specify the target PDF output file as:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true")
$vbLabelText   $csharpLabel

In the above code, properties are specified in a single string separated by | (with key and value separated by =). Alternatively, you may specify properties separately in pairs:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf", AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, True)
$vbLabelText   $csharpLabel

To make the text invisible or transparent, you simply set PROP_PDF_OUTPUT_TEXT_VISIBLE to "false". Both normal PDF and PDF/A are supported. Please refer to Asprise OCR Property Summary. Set the output format as OUTPUT_FORMAT_RTF. You can then output .rtf files that can be edited in most word processors (Microsoft Word, Libre Office, TextEdit, etc.).

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF, "PROP_RTF_OUTPUT_FILE=ocr-result.rtf")
$vbLabelText   $csharpLabel

Once the OCR is done, you can view or edit the RTF file with a word processor:

Asprise Ocr Alternatives 8 related to 5.1 Using Asprise OCR

You use the following method to perform OCR on a PDF input file:

Asprise Ocr Alternatives 9 related to 5.1 Using Asprise OCR

5.2 Korzystanie z IronOCR

Możemy również używać OCRInput do zarządzania plikami PDF. Every page of documents will be read by the Iron Tesseract class. Następnie tekst zostanie wyodrębniony ze stron. We may also open protected documents using a second function called AddPdf, which allows us to add PDFs to our list of documents (password if it is protected). Poniższy kod pokazuje, jak otworzyć dokument PDF chroniony hasłem:

using IronOcr;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add a password protected PDF
    Input.AddPdf("example.pdf", "password");

    // Read the PDF document
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add a password protected PDF
    Input.AddPdf("example.pdf", "password");

    // Read the PDF document
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Using Input = New OcrInput()
	' Add a password protected PDF
	Input.AddPdf("example.pdf", "password")

	' Read the PDF document
	Dim Result = Ocr.Read(Input)

	' Output the recognized text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

We can read and extract content from a single page in a PDF document using AddpdfPage. Only the page number from which we want to extract the text needs to be specified. AddPdfPage allows us to extract text from numerous pages that we specify. In IEnumerable<int>, we can easily specify multiple pages. Musimy również uwzględnić lokalizację pliku oraz jego rozszerzenie. Pokazuje to poniższy przykład kodu:

using IronOcr;
using System.Collections.Generic;

IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Extract single page
    Input.AddPdfPage("example.pdf", 10);

    // Extract multiple pages
    Input.AddPdfPages("example.pdf", numbers);

    // Read the pages and extract content
    var Result = Ocr.Read(Input);

    // Output the recognized text and save to a text file
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
using IronOcr;
using System.Collections.Generic;

IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Extract single page
    Input.AddPdfPage("example.pdf", 10);

    // Extract multiple pages
    Input.AddPdfPages("example.pdf", numbers);

    // Read the pages and extract content
    var Result = Ocr.Read(Input);

    // Output the recognized text and save to a text file
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
Imports IronOcr
Imports System.Collections.Generic

Private numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
	' Extract single page
	Input.AddPdfPage("example.pdf", 10)

	' Extract multiple pages
	Input.AddPdfPages("example.pdf", numbers)

	' Read the pages and extract content
	Dim Result = Ocr.Read(Input)

	' Output the recognized text and save to a text file
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using
$vbLabelText   $csharpLabel

Using the SaveAsTextFile function, we can store the result as a text file, which allows us to download the file to the output directory path. Also, we can save the file into an HTML file using SaveAsHocrFile.

6.0 Inne funkcje

6.1 Using Asprise OCR

Asprise OCR has some additional options such as Draw Text Area, Draw Picture Area, Draw Table Area, Draw Recognize Area, etc. These all help the user to improve the performance of the OCR. Not only does the application perform OCR, but we are also able to do operations such as combine PDFs, split PDFs, edit PDFs, etc.

6.2 Korzystanie z IronOCR

IronOCR posiada unikalne funkcje, które pozwalają nam odczytywać kody kreskowe i kody QR ze skanowanych dokumentów. The below codes show how we can read a barcode from a given image or document.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image containing a barcode
    Input.AddImage("barcode.gif");

    // Read the image to recognize text and barcodes
    var Result = Ocr.Read(Input);

    // Loop through barcodes and output the value
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image containing a barcode
    Input.AddImage("barcode.gif");

    // Read the image to recognize text and barcodes
    var Result = Ocr.Read(Input);

    // Loop through barcodes and output the value
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	' Add an image containing a barcode
	Input.AddImage("barcode.gif")

	' Read the image to recognize text and barcodes
	Dim Result = Ocr.Read(Input)

	' Loop through barcodes and output the value
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel

Powyższy kod służy do odczytu BARCODE'a z podanego obrazu lub dokumentu PDF. It can read more than one barcode from a page/image. To read a barcode, IronOCR has a unique setting, Ocr.Configuration.ReadBarCodes, which helps to read a barcode. Wartość domyślna jest ustawiona na false.

After reading the input, the data will be saved into the object called OCRResult. This has a property called Barcodes, and it will have all the available barcode data in a list. By using the for-each loop, we can get all the barcode details one by one. Ponadto skanuje BarCode i odczytuje jego wartość — dwie operacje wykonywane w ramach jednego procesu.

It will also support threading options. Możemy przeprowadzać wiele procesów OCR jednocześnie. IronOCR jest również w stanie rozpoznać określony obszar z wyznaczonego regionu.

using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the area to recognize text
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add the document with the specified content area
    Input.Add("document.png", ContentArea);

    // Perform OCR on the specified region
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
} 
using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the area to recognize text
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add the document with the specified content area
    Input.Add("document.png", ContentArea);

    // Perform OCR on the specified region
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
} 
Imports IronOcr
Imports System.Drawing

Private Ocr = New IronTesseract()
Using Input = New OcrInput()
	' Define the area to recognize text
	Dim ContentArea = New Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}

	' Add the document with the specified content area
	Input.Add("document.png", ContentArea)

	' Perform OCR on the specified region
	Dim Result = Ocr.Read(Input)

	' Output the recognized text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Powyżej znajduje się przykładowy kod służący do przeprowadzenia OCR w określonym obszarze. We only need to specify the rectangle region in the image or PDF. Silnik Tesseract w IronOCR pomaga nam rozpoznawać tekst.

7.0 IronOCR and Asprise OCR License Models and Pricing

IronOCR License Models and Prices

A 30-day money-back guarantee: when the license is purchased you will get 30 days of money back if the license does not work.

Easy integration: the integration of IronOCR with a project and environment is so easy that we can do it by just writing a single line of code and adding it from NuGet Package. Możemy też pobrać go z sieci i w ten sposób zintegrować z naszym środowiskiem.

Perpetual Licensing: each license is purchased once and does not require renewal.

Free Support and Product Updates: every license comes with a year of free product updates and support from the team behind the product. Rozszerzenia można kupić w dowolnym momencie. Rozszerzenia można wyświetlić.

Immediate Licenses: registered license keys are sent out as soon as payment is received.

Wszystkie licencje są bezterminowe i mają zastosowanie do środowisk programistycznych, testowych i produkcyjnych.

The Lite License:

  • 1 developer
  • 1 location
  • 1 project
  • Perpetual license

This package allows a single software developer in an organization to utilize Iron Software in a single place. Oprogramowanie Iron Software może być używane w pojedynczej aplikacji internetowej, aplikacji intranetowej lub programie komputerowym. Licenses are non-transferable, and they cannot be shared outside of an organization or an agency/client relationship. This license type, like all other license types, expressly excludes all rights not expressly granted under the Agreement, without OEM redistribution and utilizing the Iron Software as a SaaS without purchasing additional coverage.

Pricing: Starts from $799 per year.

The Professional License:

  • 10 developers
  • 10 locations
  • 10 projects
  • Perpetual license

This package allows a predetermined number of software developers in an organization to utilize Iron Software in single locations, up to a maximum of ten. Oprogramowanie Iron Software może być używane na dowolnej liczbie stron internetowych, w aplikacjach intranetowych lub aplikacjach desktopowych. Licencje są nieprzenoszalne i nie można ich udostępniać poza organizacją lub relacją agencja/klient. Ten typ licencji, podobnie jak wszystkie inne typy licencji, wyraźnie wyklucza wszelkie prawa, które nie zostały wyraźnie przyznane w Niniejszej umowie, w tym redystrybucję OEM oraz wykorzystywanie oprogramowania Iron Software jako SaaS bez zakupu dodatkowego ubezpieczenia. Licencja ta może zostać zintegrowana z jednym projektem, maksymalnie do 10.

Ceny: Od {{asprise_ocr.Lite}} rocznie.

The Unlimited License:

  • Unlimited developers
  • Unlimited locations
  • Unlimited projects
  • Perpetual license

Dzięki temu nieograniczona liczba programistów w organizacji może korzystać z oprogramowania Iron Software w nieograniczonej liczbie lokalizacji. Oprogramowanie Iron Software może być używane na dowolnej liczbie stron internetowych, w aplikacjach intranetowych lub aplikacjach desktopowych. Licencje są nieprzenoszalne i nie można ich udostępniać poza organizacją lub relacją agencja/klient. Ten typ licencji, podobnie jak wszystkie inne typy licencji, wyraźnie wyklucza wszelkie prawa, które nie zostały wyraźnie przyznane w Niniejszej umowie, w tym redystrybucję OEM oraz wykorzystywanie oprogramowania Iron Software jako SaaS bez zakupu dodatkowego ubezpieczenia.

Ceny: Od $2,999 rocznie.

Redystrybucja bez opłat licencyjnych: Umożliwia to dystrybucję oprogramowania Iron Software jako części wielu różnie pakowanych produktów komercyjnych (bez konieczności płacenia opłat licencyjnych) w oparciu o liczbę projektów objętych licencją podstawową. Umożliwia wdrożenie oprogramowania Iron Software w ramach usług SaaS, w oparciu o liczbę projektów objętych licencją podstawową.

Ceny: Od $1,599 rocznie.

Asprise Ocr Alternatives 10 related to IronOCR License Models and Prices

Asprise OCR License Models and Pricing

The Lite License:

  • Unlimited end-users
  • Recognize text
  • Read 1D barcodes: UPC, EAN, Code39, Code128
  • Text, XML, and PDF output
  • Easy deployment
  • Support 2 OS only
  • Seats 1
  • Support: No

Pricing: Starts from $7998 per year.

The Standard License:

  • Unlimited end-users
  • BMP, GIF, PNG, JPEG, TIFF, and PDF input.
  • Recognize text
  • Read 1D barcodes: UPC, EAN, Code39, Code128
  • Read some 2D: QR and Data Matrix only
  • Text, XML, and PDF output
  • Easy deployment
  • Support: No

Pricing: Starts from $7,998 per year.

The Enterprise License:

  • Unlimited end-users
  • BMP, GIF, PNG, JPEG, TIFF, and PDF input.
  • Recognize text
  • Read 1D barcodes: UPC, EAN, Code39, Code128
  • 2D: QR, PDF 417, Data Matrix & Aztec
  • Text, XML, and PDF output
  • Easy deployment
  • Multi-threading, multi-processing

Pricing: Starts from $12,998.

Asprise Ocr Alternatives 11 related to Asprise OCR License Models and Pricing

The IronOCR Lite including a one-developer package with one year of support costs around $799, while Asprise Lite including a one-developer package costs $7998 without technical support, and $6,296 with paid technical support. The IronOCR Professional license including a 10-developer package with one year of technical support costs $999, while the equivalent Asprise license including a 10-developer package costs $37,998 per year without technical support, but with paid technical releases and updates, plus support for one year, costs $46,999.00.

Pakiety IronOCR Lite i Professional obejmują usługę SaaS lub licencję OEM oraz opcję 5-letniego wsparcia technicznego. The Lite version, including one developer package with 5-year support and SaaS and OEM service, costs $2897USD, while Asprise has a SaaS or OEM service and a customized support option. The IronOCR Professional version includes a 10-developer package with one year of paid support and SaaS and OEM service costs $3397, while the Asprise version with a 10-developer package without 1-year support and with SaaS and OEM service costs $59,996.

8.0 Conclusion

IronOCR in the .NET Framework context provides Tesseract that is straightforward and easy to use. Obsługuje zdjęcia i dokumenty PDF na wiele różnych sposobów. Zapewnia również szereg ustawień służących poprawie wydajności biblioteki OCR Tesseract. Obsługiwanych jest wiele języków, a także wiele języków w ramach jednej operacji. Aby dowiedzieć się więcej o Tesseract OCR, odwiedź ich stronę internetową.

Asprise is a software application that uses an artificial intelligence engine to recognize images and PDF documents. Oferuje również różne ustawienia pozwalające poprawić wydajność procesu OCR. Ponadto oferuje możliwość wyboru wielu języków. Asprise does have some limitations on the usage of page conversions. Ceny różnią się w zależności od systemu operacyjnego.

IronOCR packages provide better licensing and support compared to Asprise. Asprise OCR has customized and fixed packages that are more expensive. IronOCR starts from $799, while Asprise OCR starts from $7994 per year, so our product is more cost-effective while also providing more features than Aspire. It also supports multiple platforms at a single price.

Na co więc czekasz? Bezpłatna wersja próbna jest dostępna dla wszystkich. You can obtain the License here and begin straightaway.

Zwróć uwagęAspose jest zastrzeżonym znakiem towarowym odpowiedniego właściciela. Ta strona nie jest powiązana z firmą Aspose, nie jest przez nią promowana ani sponsorowana. Wszystkie nazwy produktów, logo i marki są własnością ich odpowiednich właścicieli. Porównania mają charakter wyłącznie informacyjny i odzwierciedlają informacje dostępne publicznie w momencie pisania.

Często Zadawane Pytania

Czym jest optyczne rozpoznawanie znaków?

Optyczne rozpoznawanie znaków (OCR) to technologia służąca do konwersji różnych typów dokumentów, takich jak zeskanowane dokumenty papierowe, pliki PDF lub zdjęcia wykonane aparatem cyfrowym, na dane edytowalne i przeszukiwalne. Narzędzia takie jak IronOCR służą do wykonywania OCR poprzez konwersję obrazów tekstu na rzeczywiste dane tekstowe.

Jak mogę przekonwertować obrazy na tekst przy użyciu języka C#?

IronOCR zapewnia solidne rozwiązanie do konwersji obrazów na tekst w języku C#. Możesz wykorzystać jego potężne możliwości OCR do przetwarzania plików graficznych i wyodrębniania tekstu, nawet z obrazów o niskiej jakości, przy użyciu silnika Tesseract 5.

Jakie formaty obsługuje IronOCR w operacjach OCR?

IronOCR obsługuje szeroki zakres formatów do operacji OCR, w tym JPEG, PNG, GIF, BMP, TIFF i PDF. Obsługuje również dokumenty wielostronicowe oraz pliki PDF chronione hasłem.

Jak zainstalować IronOCR w moim projekcie C#?

Możesz zainstalować IronOCR w swoim projekcie C# za pomocą menedżera pakietów NuGet w Visual Studio. Alternatywnie możesz użyć wiersza poleceń z poleceniem Install-Package IronOCR lub pobrać go bezpośrednio ze strony internetowej IronOCR.

Jakie są zalety korzystania z IronOCR w porównaniu z innymi bibliotekami OCR?

IronOCR oferuje obszerną obsługę języków, doskonałą wydajność przy obrazach niskiej jakości oraz funkcje takie jak rozpoznawanie kodów BarCode i kodów QR. Zapewnia opłacalne licencjonowanie i obsługuje wiele platform w ramach jednej ceny, co czyni go wszechstronnym wyborem dla programistów.

Czy IronOCR obsługuje dokumenty wielostronicowe?

Tak, IronOCR może przetwarzać dokumenty wielostronicowe, w tym pliki TIFF i PDF, skutecznie wyodrębniając tekst z każdej strony. Jest to szczególnie przydatne w przypadku obsługi dużych dokumentów lub przetwarzania wsadowego.

Jakie opcje licencyjne są dostępne dla IronOCR?

IronOCR oferuje elastyczne, wieczyste opcje licencyjne, w tym licencje Lite, Professional i Unlimited. Licencje te są bez opłat licencyjnych i obsługują usługi SaaS oraz OEM, dzięki czemu nadają się do różnych scenariuszy wdrożeniowych.

Jak IronOCR radzi sobie z ekstrakcją tekstu z obrazów o niskiej jakości?

IronOCR wyróżnia się w pozyskiwaniu tekstu z obrazów o niskiej jakości dzięki wykorzystaniu zaawansowanych technik przetwarzania wstępnego w celu poprawy jakości obrazu przed wykonaniem OCR. Znacznie poprawia to dokładność rozpoznawania tekstu.

Kannaopat Udonpant
Inżynier oprogramowania
Zanim stał się inżynierem oprogramowania, Kannapat ukończył doktorat z zasobów środowiskowych na Uniwersytecie Hokkaido w Japonii. W czasie studiowania, Kannapat również został członkiem Laboratorium Robotyki Pojazdów, które jest częścią Wydziału Inżynierii Bioprodukcji. W 2022 roku wykorzystał swoje umiejętności w ...
Czytaj więcej

Zespol wsparcia Iron

Jestesmy online 24 godziny, 5 dni w tygodniu.
Czat
Email
Zadzwon do mnie