Zum Fußzeileninhalt springen
MIT ANDEREN KOMPONENTEN VERGLEICHEN

Ein Vergleich zwischen IronOCR und PDFTRON OCR

OCR steht für "Optische Zeichenerkennung". Dies ist der Prozess der Umwandlung von Papierdokumenten oder Bildern in lesbaren Text. Es gibt verschiedene Methoden, um dies zu tun, wie z.B. Scannen oder manuelle Eingabe über eine Tastatur. Dies wird getan, um gescannte Dateien und PDFs in ihr ursprüngliches Textformat umzuwandeln. Dieser Prozess hat sich in Strafsachen als unschätzbar erwiesen, wenn Dokumente zu beschädigt für die manuelle Transkription sind, aber durch OCR-Software gescannt und interpretiert werden können.

Mit dem Fortschritt der Technologie und der allgegenwärtigen Einführung digitaler Werkzeuge wurde OCR auch in anderen Bereichen implementiert, z. B. bei der Dokumentenkonvertierung in Anwendungen wie Google Docs sowie in der Wissenschaft und der Geschäftswelt. Es gibt zwei Haupttypen von OCR, "statisch" und "dynamisch". Der häufigste Typ ist statische OCR, bei der das gesamte Dokument auf einmal gescannt wird. Dynamische OCR hingegen scannt eine Zeile nach der anderen und kann komplexere Layouts wie tabellarische Daten verarbeiten.

Dieser Artikel wird den Vergleich zwischen zwei der am weitesten verbreiteten Anwendungen und Dokumentbibliotheken für OCR und PDF erörtern. Diese sind:

  • PDFTron OCR
  • IronXL

1.0 Einführung

1.1 PDFTron OCR Einführung und Merkmale

Um OCR mit dem PDFTron SDK zu verwenden, müssen wir ein separates OCR-Modul-Add-On-Tool installieren. Dies hilft dem SDK, Text aus Dokumenten zu erkennen. Es kann Text auswählbar und durchsuchbar machen. Das PDFTron SDK unterstützt bis zu 100 Sprachen. Die PDFTron OCR-Engine wird von einem Open-Source-LSTM-Neuronalen Netzwerk von Tesseract unterstützt. PDFTron OCR unterstützt mehrere Bildformate für die Texterkennung. Auch PDF-Dateien mit nur Rasterbildern werden für OCR akzeptiert, wobei die Ausgabequalität von der Eingabebildqualität abhängt. Die besten Bilder für OCR sind Graustufenbilder mit 300 DPI Auflösung.

Die Merkmale von PDFTron OCR

  • Bilder in gedruckten Dokumenten durchsuchbar machen.
  • Einfaches PDF in ein durchsuchbares PDF umwandeln.
  • Wichtige Informationen aus Geschäftsdokumenten erkennen.
  • Buchscannen vereinfachen.
  • Fahrzeugnummern aus Fahrzeugbildern erkennen.
  • Sehbehinderten-Nutzer unterstützen.
  • It vereinfacht die Dateneingabe in mehrere Dokumente aus Dateien mit OCR.
  • Informationen von Visitenkarten einfach in Kontaktlisten übertragen.

1.2 IronOCR — Einführung und Funktionen

Iron Software bietet Softwareentwicklern IronOCR für .NET, um Textinhalte aus Fotos und PDFs in .NET-Anwendungen und Websites zu lesen. Die Software hilft dabei, Fotos nach Text und Barcodes zu scannen, unterstützt zahlreiche Weltsprachen und gibt als einfacher Text oder strukturierte Daten aus. Die OCR-Bibliothek von Iron Software kann in Web-, Konsolen-, MVC- und zahlreichen .NET-Desktop-Anwendungen verwendet werden. Bei kommerzieller Bereitstellung wird zusammen mit erworbenen Lizenzen direkte Unterstützung vom Entwicklungsteam bereitgestellt.

  • IronXL uses the latest Tesseract 5 engine which reads text, QR codes, and barcodes, from any PDF format or. Das Hinzufügen von OCR zu Desktop-, Web-Anwendungen und Konsolen mit dieser Bibliothek gewährleistet eine schnelle Integration.
  • IronXL supports 125 international languages. Sie unterstützt auch benutzerdefinierte Sprachen und Wortlisten.
  • IronXL can read more than 20 barcode and QR code formats.
  • Unterstützt mehrseitige GIF- und TIFF-Bildformate.
  • Korrigiert minderwertige Scans und Bilder.
  • Unterstützt Multithreading. Es kann ein oder mehrere Prozesse gleichzeitig ausführen.
  • IronXL can provide structured data output to pages, paragraphs, lines, words, characters, etc.
  • IronXL supports operating systems such as Windows, Linux, macOS, etc.

2. Erstellen eines neuen Projekts in Visual Studio

Öffnen Sie Visual Studio und suchen Sie im Dateimenü. Wählen Sie neues Projekt, dann Konsolenanwendung. Zur Erstellung von PDF-Dokumenten werden wir in diesem Artikel die Konsolenanwendung verwenden.

class="content-img-align-center"> Pdftron Ocr Alternatives 1 related to 2. Erstellen eines neuen Projekts in Visual Studio

class="content__image-caption">

Geben Sie den Projektnamen ein und wählen Sie den Dateipfad im entsprechenden Textfeld aus. Klicken Sie dann auf die Erstellen-Schaltfläche. Wählen Sie auch das erforderliche .NET Framework aus.

Das Visual Studio-Projekt wird nun die Struktur für die ausgewählte Anwendung generieren.

Die Struktur des Projekts wird nun von Visual Studio generiert. Die Datei program.cs wird geöffnet, wenn Sie Windows, Konsole und Webanwendung ausgewählt haben, damit Sie den Code eingeben und Ihre Anwendung erstellen/ausführen können.

class="content-img-align-center"> Pdftron Ocr Alternatives 2 related to 2. Erstellen eines neuen Projekts in Visual Studio

class="content__image-caption">

Für den nächsten Schritt müssen wir die Bibliothek zum Testen des Codes hinzufügen.

3.0 Installieren

3.1 PDFtron OCR Installieren

The PDFTron OCR installation is completed manually and can be downloaded as a zip from the given link. Entpacken und konfigurieren Sie es mit dem Projekt. Die Anleitung hilft Ihnen, PDFTron-Beispiele mit dem kostenlosen integrierten Test des PDFTron SDK in einer .NET Framework-Anwendung unter Windows auszuführen. Unterstützung von Lösungstechnikern und unbegrenzte Testnutzung sind im kostenlosen Test enthalten.

Voraussetzungen

Visual Studio: Stellen Sie sicher, dass die .NET Desktop Development- und .NET Framework 4.5.1+ Entwicklungstools-Arbeitslast Teil Ihrer Installation sind. Diese Anleitung verwendet Visual Studio 2017 und die C# .NET PDF-Bibliothek von PDFTron für Windows. Download the library using this link, .NET PDF SDK Download.

Erstkonfiguration

Extrahieren Sie den Ordner aus der .zip-Datei. PDFNET_BASE wird in dieser Anleitung verwendet, um den Pfad in den extrahierten Ordner auszuwählen.

// Set the base path where the extracted files are located
PDFNET_BASE = "path/to/extraction/folder/PDFNetDotNet4/";
// Set the base path where the extracted files are located
PDFNET_BASE = "path/to/extraction/folder/PDFNetDotNet4/";
' Set the base path where the extracted files are located
PDFNET_BASE = "path/to/extraction/folder/PDFNetDotNet4/"
$vbLabelText   $csharpLabel

Die Beispiele ausführen

Navigieren Sie zum Standort der extrahierten Inhalte. Finden und betreten Sie den Samples-Ordner (PDFNET_BASE/Samples). Dieser Ordner enthält zahlreiche Beispielcodes für vom PDFTron SDK unterstützte Funktionen.

  1. Öffnen Sie Samples_20XX.sln in Visual Studio. Wählen Sie eine geeignete Version für Ihre Visual Studio-Installation.
  2. Select the sample code and set it as the Startup Project for the solution.
  3. Führen Sie das Projekt aus.

In Ihre Anwendung integrieren

Dies wird als "PDFTron Hello World"-Anwendung bezeichnet. Es ist einfach, den Rest des PDFTron SDK zu integrieren, wenn Sie ein PDF-Dokument öffnen, speichern und schließen können.

  1. Erstellen Sie in Visual Studio ein Konsolenanwendungsprojekt im .NET Framework in Ihrer bevorzugten Sprache. Sie finden sie in der Kategorie Visual C# oder Visual Basic.
  2. Navigieren Sie in den Ordner Ihres Projekts. Standardmäßig sollte der Pfad ähnlich sein zu: C:/Users/User_Name/source/repos/myApp
  3. Von PDFNET_BASE in Ihren Projektordner (dieser Ordner enthält Ihre .csproj- oder .vbproj-Datei) kopieren Sie den Lib-Ordner.
  4. Finden Sie den Solution Explorer auf der rechten Seite. Wählen Sie die Option "Add Reference", indem Sie mit der rechten Maustaste auf "References" klicken. Dies öffnet einen Referenzmanager-Dialog.
  5. Wählen Sie am unteren Rand des Dialogs "Browse" aus. Suchen Sie in den kopierten Lib-Ordner, um PDFNetLoader.dll zu den Verweisen hinzuzufügen.
  6. Fügen Sie zusätzlich aus dem x86-Ordner die geeignete Version von PDFNet.dll als weiteren Verweis hinzu (Pfad/zu/Ihrem/Projektordner/Lib/PDFNet/x86/PDFNet.dll). Dies stellt sicher, dass die Anwendung sowohl auf 32-Bit- als auch auf 64-Bit-Betriebssystemen läuft.
  7. Klicken Sie auf PDFNet.dll. Stellen Sie sicher, dass Sie seine "Copy Local"-Eigenschaft auf "False" setzen.
class="content-img-align-center"> Pdftron Ocr Alternatives 3 related to In Ihre Anwendung integrieren

class="content__image-caption">

3.2 Installation von IronOCR

Die IronOCR-Bibliothek kann auf vier Arten installiert werden.

Diese sind:

  • Verwenden Sie Visual Studio.
  • Verwenden der Visual Studio-Befehlszeile.
  • Direkter Download von der NuGet-Website.
  • Direkter Download von der IronOCR-Website.

3.2.1 Verwenden von Visual Studio

Die Visual Studio-Software bietet die Option des NuGet-Paketmanagers, um das Paket direkt zur Lösung zu installieren. Die Abbildung zeigt, wie Sie den NuGet-Paket-Manager öffnen.

class="content-img-align-center"> Pdftron Ocr Alternatives 4 related to 3.2.1 Verwenden von Visual Studio

class="content__image-caption">

Dies wird eine Suchmaske bereitstellen, um die Liste der Pakete von der NuGet-Website anzuzeigen. Im Paketmanager müssen wir nach dem Stichwort "IronOCR" suchen, wie im folgenden Screenshot:

class="content-img-align-center"> Pdftron Ocr Alternatives 5 related to 3.2.1 Verwenden von Visual Studio

class="content__image-caption">

Aus dem obigen Bild sehen wir die Liste der verwandten Suchergebnisse. Um das Paket in die Lösung zu installieren, müssen wir die erforderliche Option auswählen.

3.2.2 Verwenden der Visual Studio-Kommandozeile

  • In Visual Studio: Gehe zu Tools-> NuGet-Paketmanager -> Paketmanager-Konsole
  • Geben Sie den folgenden Codeausschnitt in die Registerkarte der Paketmanager-Konsole ein.
Install-Package IronOcr

Das Paket wird jetzt direkt in das aktuelle Projekt installiert, das dann einsatzbereit ist.

3.2.3 Direkter Download von der NuGet-Website

Für die dritte Methode können wir das NuGet-Paket direkt von der Website herunterladen

  • Navigieren Sie zu diesem Link.
  • Stellen Sie sicher, dass Sie im Menü auf der rechten Seite die Option zum Herunterladen des Pakets auswählen.
  • Doppelklicken Sie auf das heruntergeladene Paket. Es wird automatisch installiert.
  • Laden Sie dann die Lösung neu und beginnen Sie damit, sie im Projekt zu verwenden.

3.2.4 Direkter Download von der IronOCR-Website

Sie können das neueste Paket direkt von der Website herunterladen, indem Sie auf diesen Link klicken. Befolgen Sie die bereitgestellten Anweisungen, um das Paket zum Projekt hinzuzufügen, sobald das neueste Paket heruntergeladen wurde.

  • Klicken Sie mit der rechten Maustaste auf das Projekt im Lösungsfenster.
  • Wählen Sie die Option "Option Reference", um den Ort der heruntergeladenen Referenz zu durchsuchen.
  • Klicken Sie dann auf OK, um die Referenz hinzuzufügen.

4.0 OCR Bild

IronOCR und PDFtron OCR haben beide OCR-Technologie, die Bilder in Textsuche umwandelt.

4.1 Verwendung von PDFTron

Konvertieren Sie PDF zu DOCX, DOC, HTML, SVG, TIFF, PNG, JPEG, XPS, EPUB, TXT und vielen anderen Formaten.

// Create a new PDF document
PDFDoc doc = new PDFDoc("sample.pdf");

// Convert PDF document to SVG
Convert.ToSvg(doc, "output.svg");

// Convert PDF document to XPS
Convert.ToXps("sample.pdf", "output.xps");

// Convert PDF document to multipage TIFF
Convert.TiffOutputOptions tiff_options = new Convert.TiffOutputOptions();
tiff_options.SetDPI(200);
tiff_options.SetDither(true);
tiff_options.SetMono(true);
Convert.ToTiff("sample.pdf", "output.tiff", tiff_options);

// Convert PDF to XOD
Convert.ToXod("sample.pdf", "output.xod");

// Convert PDF to HTML
Convert.ToHtml("sample.pdf", "output.html");
// Create a new PDF document
PDFDoc doc = new PDFDoc("sample.pdf");

// Convert PDF document to SVG
Convert.ToSvg(doc, "output.svg");

// Convert PDF document to XPS
Convert.ToXps("sample.pdf", "output.xps");

// Convert PDF document to multipage TIFF
Convert.TiffOutputOptions tiff_options = new Convert.TiffOutputOptions();
tiff_options.SetDPI(200);
tiff_options.SetDither(true);
tiff_options.SetMono(true);
Convert.ToTiff("sample.pdf", "output.tiff", tiff_options);

// Convert PDF to XOD
Convert.ToXod("sample.pdf", "output.xod");

// Convert PDF to HTML
Convert.ToHtml("sample.pdf", "output.html");
' Create a new PDF document
Dim doc As New PDFDoc("sample.pdf")

' Convert PDF document to SVG
Convert.ToSvg(doc, "output.svg")

' Convert PDF document to XPS
Convert.ToXps("sample.pdf", "output.xps")

' Convert PDF document to multipage TIFF
Dim tiff_options As New Convert.TiffOutputOptions()
tiff_options.SetDPI(200)
tiff_options.SetDither(True)
tiff_options.SetMono(True)
Convert.ToTiff("sample.pdf", "output.tiff", tiff_options)

' Convert PDF to XOD
Convert.ToXod("sample.pdf", "output.xod")

' Convert PDF to HTML
Convert.ToHtml("sample.pdf", "output.html")
$vbLabelText   $csharpLabel

4.2 Verwendung von IronOCR

// Create an IronTesseract object
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

using (var Input = new OcrInput())
{
    // Add an image for OCR
    Input.AddImage(@"3.png");
    // Read the text from the image
    var Result = Ocr.Read(Input);
    // Print the text to the console
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
// Create an IronTesseract object
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

using (var Input = new OcrInput())
{
    // Add an image for OCR
    Input.AddImage(@"3.png");
    // Read the text from the image
    var Result = Ocr.Read(Input);
    // Print the text to the console
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
' Create an IronTesseract object
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5

Using Input = New OcrInput()
	' Add an image for OCR
	Input.AddImage("3.png")
	' Read the text from the image
	Dim Result = Ocr.Read(Input)
	' Print the text to the console
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
$vbLabelText   $csharpLabel

Oben gezeigt wird der Prozess der Bilder in Textumwandlung mit der Tesseract 5 API. Die obige Codezeile wurde verwendet, um ein Objekt für Iron Tesseract zu erstellen. Darüber hinaus haben wir, um sicherzustellen, dass wir eines oder mehrere Bilder hinzufügen können, ein OcrInput-Objekt erstellt, das den verfügbaren Bildpfad erfordert. Im Iron Tesseract-Objekt kann die Funktion "Read" verwendet werden, um die Bilder zu erfassen, indem die Bilddatei geparst wird und das erzeugte Ergebnis in das OCR-Ergebnis extrahiert wird. Es ist in der Lage, Text aus Fotos zu extrahieren und in einen String zu konvertieren.

Tesseract kann verwendet werden, um mehrseitige Bilder mit der "AddMultiFrameTiff"-Methode hinzuzufügen. Jeder Frame im Bild wird vom Tesseract Library gelesen und als eigenständige Seite behandelt. Jeder Frame des Bildes wird gelesen, bevor der nächste Frame fortgesetzt wird, bis jeder Frame erfolgreich gescannt wurde. Das TIFF-Bildformat ist das einzige unterstützte Format bei dieser Methode.

class="content-img-align-center"> Pdftron Ocr Alternatives 6 related to 4.2 Verwendung von IronOCR

class="content__image-caption">

Die erfolgreiche Umwandlung der Daten in editierbaren Text wird im obigen Bild angezeigt, ein Ergebnis der Genauigkeit von IronOCR.

5.0 OCR PDF-Datei

IronOCR und PDFTron OCR konvertieren PDF-Dateien in editierbaren Text. PDFTron OCR bietet dem Benutzer eine Liste von Optionen wie das Speichern der Seite, das Bearbeiten des Bildes, die Seitenerkennung usw. Darüber hinaus kann es Speicheroptionen wie Dokument, Text, HTML-Format usw. bereitstellen. IronOCR ermöglicht es uns ebenfalls, eine konvertierte OCR-Datei in HTML, Text, PDF usw. zu speichern.

5.1 Verwendung von PDFTron OCR

Der vollständige Beispielcode zeigt, wie man PDFTron OCR für die direkte, hochwertige Konvertierung zwischen PDF, XPS, EMF, SVG, TIFF, PNG, JPEG und anderen Bildformaten verwendet.

// Copyright (c) 2001-2021 by PDFTron Systems Inc. All Rights Reserved.

using System;
using pdftron;
using pdftron.Common;
using pdftron.Filters;
using pdftron.SDF;
using pdftron.PDF;

// This code demonstrates conversion of documents to formats such as SVG, PDF, EMF, or XPS.

namespace ConvertTestCS
{
    class Testfile
    {
        public string inputFile, outputFile;
        public bool requiresWindowsPlatform;
        public Testfile(string inFile, string outFile, bool requiresWindowsPlatform_)
        {
            inputFile = inFile;
            outputFile = outFile;
            requiresWindowsPlatform = requiresWindowsPlatform_;
        }
    };

    class Class1
    {
        private static pdftron.PDFNetLoader pdfNetLoader = pdftron.PDFNetLoader.Instance();
        static Class1() {}

        // Relative paths to the input and output folders.
        const string inputPath = "../../../../TestFiles/";
        const string outputPath = "../../../../TestFiles/Output/";

        static bool ConvertSpecificFormats()
        {
            bool err = false;
            try
            {
                using (PDFDoc pdfdoc = new PDFDoc())
                {
                    // Convert from XPS to PDF
                    Console.WriteLine("Converting from XPS");
                    pdftron.PDF.Convert.FromXps(pdfdoc, inputPath + "simple-xps.xps");
                    pdfdoc.Save(outputPath + "xps2pdf v2.pdf", SDFDoc.SaveOptions.e_remove_unused);
                    Console.WriteLine("Saved xps2pdf v2.pdf");
                }
            }
            catch (PDFNetException e)
            {
                Console.WriteLine(e.Message);
                err = true;
            }

            // Other format conversions...

            return err;
        }

        static Boolean ConvertToPdfFromFile()
        {
            System.Collections.ArrayList testfiles = new System.Collections.ArrayList();
            testfiles.Add(new ConvertTestCS.Testfile("simple-word_2007.docx", "docx2pdf.pdf", false));
            // Add other test files...

            bool err = false;

            foreach (Testfile file in testfiles)
            {
                try
                {
                    using (pdftron.PDF.PDFDoc pdfdoc = new PDFDoc())
                    {
                        // Conditions and conversions...
                        pdftron.PDF.Convert.ToPdf(pdfdoc, inputPath + file.inputFile);
                        pdfdoc.Save(outputPath + file.outputFile, SDFDoc.SaveOptions.e_linearized);
                        Console.WriteLine("Converted file: " + file.inputFile);
                        Console.WriteLine("to: " + file.outputFile);
                    }
                }
                // Catch exceptions...
            }

            return err;
        }

        static void Main(string [] args)
        {
            PDFNet.Initialize(PDFTronLicense.Key);
            bool err = false;

            err = ConvertToPdfFromFile();
            if (err)
            {
                Console.WriteLine("ConvertFile failed");
            }
            else
            {
                Console.WriteLine("ConvertFile succeeded");
            }

            err = ConvertSpecificFormats();
            if (err)
            {
                Console.WriteLine("ConvertSpecificFormats failed");
            }
            else
            {
                Console.WriteLine("ConvertSpecificFormats succeeded");
            }

            // Finalization...
            PDFNet.Terminate();
            Console.WriteLine("Done.");
        }
    }
}
// Copyright (c) 2001-2021 by PDFTron Systems Inc. All Rights Reserved.

using System;
using pdftron;
using pdftron.Common;
using pdftron.Filters;
using pdftron.SDF;
using pdftron.PDF;

// This code demonstrates conversion of documents to formats such as SVG, PDF, EMF, or XPS.

namespace ConvertTestCS
{
    class Testfile
    {
        public string inputFile, outputFile;
        public bool requiresWindowsPlatform;
        public Testfile(string inFile, string outFile, bool requiresWindowsPlatform_)
        {
            inputFile = inFile;
            outputFile = outFile;
            requiresWindowsPlatform = requiresWindowsPlatform_;
        }
    };

    class Class1
    {
        private static pdftron.PDFNetLoader pdfNetLoader = pdftron.PDFNetLoader.Instance();
        static Class1() {}

        // Relative paths to the input and output folders.
        const string inputPath = "../../../../TestFiles/";
        const string outputPath = "../../../../TestFiles/Output/";

        static bool ConvertSpecificFormats()
        {
            bool err = false;
            try
            {
                using (PDFDoc pdfdoc = new PDFDoc())
                {
                    // Convert from XPS to PDF
                    Console.WriteLine("Converting from XPS");
                    pdftron.PDF.Convert.FromXps(pdfdoc, inputPath + "simple-xps.xps");
                    pdfdoc.Save(outputPath + "xps2pdf v2.pdf", SDFDoc.SaveOptions.e_remove_unused);
                    Console.WriteLine("Saved xps2pdf v2.pdf");
                }
            }
            catch (PDFNetException e)
            {
                Console.WriteLine(e.Message);
                err = true;
            }

            // Other format conversions...

            return err;
        }

        static Boolean ConvertToPdfFromFile()
        {
            System.Collections.ArrayList testfiles = new System.Collections.ArrayList();
            testfiles.Add(new ConvertTestCS.Testfile("simple-word_2007.docx", "docx2pdf.pdf", false));
            // Add other test files...

            bool err = false;

            foreach (Testfile file in testfiles)
            {
                try
                {
                    using (pdftron.PDF.PDFDoc pdfdoc = new PDFDoc())
                    {
                        // Conditions and conversions...
                        pdftron.PDF.Convert.ToPdf(pdfdoc, inputPath + file.inputFile);
                        pdfdoc.Save(outputPath + file.outputFile, SDFDoc.SaveOptions.e_linearized);
                        Console.WriteLine("Converted file: " + file.inputFile);
                        Console.WriteLine("to: " + file.outputFile);
                    }
                }
                // Catch exceptions...
            }

            return err;
        }

        static void Main(string [] args)
        {
            PDFNet.Initialize(PDFTronLicense.Key);
            bool err = false;

            err = ConvertToPdfFromFile();
            if (err)
            {
                Console.WriteLine("ConvertFile failed");
            }
            else
            {
                Console.WriteLine("ConvertFile succeeded");
            }

            err = ConvertSpecificFormats();
            if (err)
            {
                Console.WriteLine("ConvertSpecificFormats failed");
            }
            else
            {
                Console.WriteLine("ConvertSpecificFormats succeeded");
            }

            // Finalization...
            PDFNet.Terminate();
            Console.WriteLine("Done.");
        }
    }
}
' Copyright (c) 2001-2021 by PDFTron Systems Inc. All Rights Reserved.

Imports System
Imports pdftron
Imports pdftron.Common
Imports pdftron.Filters
Imports pdftron.SDF
Imports pdftron.PDF

' This code demonstrates conversion of documents to formats such as SVG, PDF, EMF, or XPS.

Namespace ConvertTestCS
	Friend Class Testfile
		Public inputFile, outputFile As String
		Public requiresWindowsPlatform As Boolean
		Public Sub New(ByVal inFile As String, ByVal outFile As String, ByVal requiresWindowsPlatform_ As Boolean)
			inputFile = inFile
			outputFile = outFile
			requiresWindowsPlatform = requiresWindowsPlatform_
		End Sub
	End Class

	Friend Class Class1
		Private Shared pdfNetLoader As pdftron.PDFNetLoader = pdftron.PDFNetLoader.Instance()
		Shared Sub New()
		End Sub

		' Relative paths to the input and output folders.
		Private Const inputPath As String = "../../../../TestFiles/"
		Private Const outputPath As String = "../../../../TestFiles/Output/"

		Private Shared Function ConvertSpecificFormats() As Boolean
			Dim err As Boolean = False
			Try
				Using pdfdoc As New PDFDoc()
					' Convert from XPS to PDF
					Console.WriteLine("Converting from XPS")
					pdftron.PDF.Convert.FromXps(pdfdoc, inputPath & "simple-xps.xps")
					pdfdoc.Save(outputPath & "xps2pdf v2.pdf", SDFDoc.SaveOptions.e_remove_unused)
					Console.WriteLine("Saved xps2pdf v2.pdf")
				End Using
			Catch e As PDFNetException
				Console.WriteLine(e.Message)
				err = True
			End Try

			' Other format conversions...

			Return err
		End Function

		Private Shared Function ConvertToPdfFromFile() As Boolean
			Dim testfiles As New System.Collections.ArrayList()
			testfiles.Add(New ConvertTestCS.Testfile("simple-word_2007.docx", "docx2pdf.pdf", False))
			' Add other test files...

			Dim err As Boolean = False

			For Each file As Testfile In testfiles
				Try
					Using pdfdoc As pdftron.PDF.PDFDoc = New PDFDoc()
						' Conditions and conversions...
						pdftron.PDF.Convert.ToPdf(pdfdoc, inputPath & file.inputFile)
						pdfdoc.Save(outputPath & file.outputFile, SDFDoc.SaveOptions.e_linearized)
						Console.WriteLine("Converted file: " & file.inputFile)
						Console.WriteLine("to: " & file.outputFile)
					End Using
				End Try
				' Catch exceptions...
			Next file

			Return err
		End Function

		Shared Sub Main(ByVal args() As String)
			PDFNet.Initialize(PDFTronLicense.Key)
			Dim err As Boolean = False

			err = ConvertToPdfFromFile()
			If err Then
				Console.WriteLine("ConvertFile failed")
			Else
				Console.WriteLine("ConvertFile succeeded")
			End If

			err = ConvertSpecificFormats()
			If err Then
				Console.WriteLine("ConvertSpecificFormats failed")
			Else
				Console.WriteLine("ConvertSpecificFormats succeeded")
			End If

			' Finalization...
			PDFNet.Terminate()
			Console.WriteLine("Done.")
		End Sub
	End Class
End Namespace
$vbLabelText   $csharpLabel

5.2 Verwendung von IronOCR

Das Management von PDF-Dateien kann mit der OCRInput-Funktion abgeschlossen werden. Jede Seite in einem Dokument wird von der Iron Tesseract-Klasse gelesen. Anschließend wird der Text von den Seiten extrahiert. Eine zweite Funktion namens "AddPDF" ermöglicht es uns, geschützte Dokumente zu öffnen und sicherzustellen, dass wir PDFs unserer Liste von Dokumenten hinzufügen können (Passwort, wenn sie geschützt sind). Um ein passwortgeschütztes PDF-Dokument zu öffnen, verwenden Sie den untenstehenden Codeausschnitt:

var Ocr = new IronTesseract(); // Configure nothing
using (var Input = new OcrInput())
{
    // Add PDF with password
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract(); // Configure nothing
using (var Input = new OcrInput())
{
    // Add PDF with password
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract() ' Configure nothing
Using Input = New OcrInput()
	' Add PDF with password
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Das Lesen und Extrahieren von Inhalten aus einer Seite in einer PDF-Datei kann durch die Verwendung der "Addpdfpage"-Funktion erreicht werden. Geben Sie nur die genaue Seitenzahl an, aus der wir Text extrahieren möchten. "AddPdfPage" ermöglicht es Ihnen, Text aus mehreren von Ihnen angegebenen Seiten zu extrahieren. IEnumerable ermöglicht es Ihnen, effizient zahlreiche Seiten zu spezifizieren. Sie müssen auch den Ort und die Erweiterung der Datei angeben. Der folgende Codeausschnitt zeigt dies:

IEnumerable<int> numbers = new List<int> {2,8,10};
// Create an IronTesseract object
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Single page
    Input.AddPdfPage("example.pdf",10);
    // Multiple pages
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    // Save result to a text file
    Result.SaveAsTextFile("ocrtext.txt");
}
IEnumerable<int> numbers = new List<int> {2,8,10};
// Create an IronTesseract object
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Single page
    Input.AddPdfPage("example.pdf",10);
    // Multiple pages
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    // Save result to a text file
    Result.SaveAsTextFile("ocrtext.txt");
}
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
' Create an IronTesseract object
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	' Single page
	Input.AddPdfPage("example.pdf",10)
	' Multiple pages
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	' Save result to a text file
	Result.SaveAsTextFile("ocrtext.txt")
End Using
$vbLabelText   $csharpLabel

Verwenden Sie die SaveAsTextFile-Funktion, um das Ergebnis direkt im Textdateiformat zu speichern, damit Sie die Datei direkt in das Ausgabeverzeichnis herunterladen können. Um die Datei im HTML-Format zu speichern, verwenden Sie SaveAsHocrFile.

6.1 Verwendung von PDFTron

Wir können das PDFTron SDK verwenden, um Bilder aus PDF-Dateien zu extrahieren, zusammen mit ihrer Positionierungsinformationen und DPI. Anstatt PDF-Bilder in eine Bitmap zu konvertieren, können Sie auch unkomprimierte/komprimierte Bilddaten direkt mit elements.GetImageData() (beschrieben im PDF-Datenextraktions-Beispielcode) extrahieren. Erfahren Sie mehr über unsere C# PDF-Bibliothek und die PDF-Parsing- und Inhaltsextraktions-Bibliothek.

6.2 Verwendung von IronOCR

IronOCR hat eine beeindruckende Anzahl von Funktionen, die es Ihnen ermöglichen, QR-Codes und Barcodes direkt aus gescannten Dokumenten zu lesen. Der folgende Codeausschnitt zeigt, wie Sie den Barcode aus einem gegebenen Bild oder Dokument scannen können.

// Create an IronTesseract object
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image with a barcode
    Input.AddImage("barcode.gif");
    // Read the image
    var Result = Ocr.Read(Input);

    // Iterate over all barcodes found and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
// Create an IronTesseract object
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image with a barcode
    Input.AddImage("barcode.gif");
    // Read the image
    var Result = Ocr.Read(Input);

    // Iterate over all barcodes found and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
' Create an IronTesseract object
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	' Add an image with a barcode
	Input.AddImage("barcode.gif")
	' Read the image
	Dim Result = Ocr.Read(Input)

	' Iterate over all barcodes found and display their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel

Der obige Code hilft, den Barcode aus einem gegebenen Bild oder PDF-Dokument zu lesen. Zahlreiche Barcodes können gleichzeitig in einem einzelnen Bild oder Seite gelesen werden. IronOCR hat eine einzigartige Methode, die den Barcode liest, Ocr.Configuration.ReadBarCodes.

Die Daten werden nach dem Scannen der Eingabe in einem Objekt namens OCRResult gespeichert. Die Eigenschaft in OCRResult heißt Barcodes, die eine Liste aller verfügbaren Barcode-Daten enthält. Wir können die einzelnen Daten in Bezug auf die Barcode-Details durch die Verwendung einer foreach-Schleife abrufen. Zwei Operationen werden in einem einzigen Prozess abgeschlossen - das Scannen und Lesen des Werts des Barcodes.

Unterstützung für Threading-Optionen ist ebenfalls verfügbar, und mehrere OCR-Prozesse können gleichzeitig abgeschlossen werden. Darüber hinaus kann IronOCR einen präzisen Bereich von einer bestimmten Region erkennen.

// Create an IronTesseract object
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the content area to be scanned
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // Add image specifying the content area
    Input.Add("document.png", ContentArea);
    // Perform OCR operation
    var Result = Ocr.Read(Input);
    // Print the text
    Console.WriteLine(Result.Text);
}
// Create an IronTesseract object
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the content area to be scanned
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // Add image specifying the content area
    Input.Add("document.png", ContentArea);
    // Perform OCR operation
    var Result = Ocr.Read(Input);
    // Print the text
    Console.WriteLine(Result.Text);
}
' Create an IronTesseract object
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	' Define the content area to be scanned
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	' Add image specifying the content area
	Input.Add("document.png", ContentArea)
	' Perform OCR operation
	Dim Result = Ocr.Read(Input)
	' Print the text
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Der obige Codeausschnitt demonstriert, wie man OCR auf einer bestimmten Region durchführt. Sie müssen nur den rechteckigen Bereich im PDF/Bild angeben, da die Tesseract-Engine von IronOCR beim Erkennen des Textes hilft.

IronOCR und PDFtron OCR-Lizenzmodelle und Preisgestaltung

IronOCR Lizenzmodelle und Preisgestaltung

Eine 30-tägige Geld-zurück-Garantie: Sobald eine Lizenz gekauft ist, erhalten Sie eine 30-tägige Geld-zurück-Garantie. Innerhalb von 30 Tagen erhalten Sie Ihr Geld zurück, wenn Sie das Produkt zurückgeben möchten.

Einfache Integration: Die Integration von IronOCR in jedes Projekt und jede Umgebung ist so mühelos, dass sie mit einer einzigen Codezeile erreicht werden kann, indem es als NuGet-Paket hinzugefügt wird. Andererseits ist eine weitere Möglichkeit zur Integration der Umgebung, sie direkt aus dem Internet herunterzuladen.

Perpetual Licensing: Jede gekaufte Lizenz erfordert keine Verlängerung.

KostEnlose Unterstützung und Produktaktualisierungen: Jede Lizenz wird direkt von der Gruppe hinter dem Produkt unterstützt und bietet ein Jahr lang kostenlose Produktaktualisierungen. Erweiterungen können jederzeit gekauft werden.

Sofortige Lizenzen: Nach Zahlungseingang werden registrierte Lizenzschlüssel sofort versendet.

Sofortige Lizenzen: Registrierte Lizenzschlüssel werden sofort nach Zahlungseingang versendet.

Die Lite Lizenz

Das Lite-Paket:

  • 1 Entwickler
  • 1 Standort
  • 1 Projekt

Dieses Paket ermöglicht einem einzelnen Softwareentwickler in einer Organisation, Iron Software an einem Standort zu nutzen. Iron Software kann in einer einzigen Intranet-Anwendung, Webanwendung oder Desktop-Software verwendet werden. Es ist verboten, Lizenzen außerhalb einer Organisation oder einer Agentur/Kundenbeziehung weiterzugeben, da sie nicht übertragbar sind. Dieser Lizenztyp, wie alle anderen Lizenztypen, schließt alle Rechte, die nicht ausdrücklich im Vertrag gewährt werden, ausdrücklich aus, ohne OEM-Weiterverteilung und der Verwendung der Iron Software als SaaS ohne zusätzlichen Versicherungsschutz zu erwerben.

Preisgestaltung: Beginnt ab $799 pro Jahr.

Die Professionelle Lizenz

Professionelle Lizenz:

  • 10 Entwickler
  • 10 Standorte
  • 1 Projekt

Diese Lizenz ermöglicht einer festgelegten Anzahl von Softwareentwicklern in einer Organisation, Iron Software an mehreren Standorten zu nutzen, mit bis zu maximal zehn. Iron Software kann in beliebig vielen Websites, Intranet-Anwendungen oder Desktop-Software-Anwendungen verwendet werden. Lizenzen sind nicht übertragbar und dürfen nicht außerhalb einer Organisation oder einer Agentur/Kundenbeziehung geteilt werden. Diese Lizenzart, wie alle anderen Lizenzarten, schließt ausdrücklich alle Rechte aus, die unter der Vereinbarung nicht ausdrücklich gewährt werden, einschließlich OEM-Weiterverbreitung und der Verwendung von Iron Software als SaaS ohne zusätzliche Abdeckung. Diese Lizenz kann in ein einziges Projekt integriert werden bis zu maximal 10.

Preis: Beginnt bei $999 pro Jahr.

Die Unbegrenzte Lizenz

Unbegrenzte Lizenz:

  • Unbegrenzte Entwickler
  • Unbegrenzte Standorte
  • 1 Projekt

Diese Lizenz erlaubt einer unbegrenzten Anzahl von Softwareentwicklern in einer Organisation, Iron Software an beliebig vielen Standorten zu verwenden. Iron Software kann in so vielen Intranet-Anwendungen, Desktop-Softwareanwendungen oder Websites verwendet werden, wie Sie möchten. Lizenzen sind nicht übertragbar und dürfen nicht außerhalb einer Organisation oder einer Agentur/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp, wie alle anderen Lizenztypen, schließt alle Rechte, die nicht im Vertrag gewährt werden, ausdrücklich aus, einschließlich OEM-Weiterverteilung und der Verwendung der Iron Software als SaaS ohne zusätzlichen Versicherungsschutz zu erwerben.

Preisgestaltung: Beginnt ab $4,799 pro Jahr.

Royalty-Free-Weiterverbreitung — Dies erlaubt Ihnen, die Iron Software als Teil mehrerer unterschiedlich verpackter kommerzieller Produkte (ohne Lizenzgebühren zahlen zu müssen) weiterzuverteilen, basierend auf der Anzahl der Projekte, die von der Basislizenz abgedeckt werden. Dies ermöglicht den Einsatz von Iron Software innerhalb von SaaS-Softwarediensten, die auf der Anzahl der durch die Basislizenz abgedeckten Projekte basieren.

Preis: Beginnt bei $1,599 pro Jahr.

class="content-img-align-center"> Pdftron Ocr Alternatives 7 related to Die Unbegrenzte Lizenz

class="content__image-caption">

PDFTron Lizenzmodelle und Preisgestaltung

PDFTron Pakete (kundenspezifische Lizenzen)

  • Die Preise für kundenspezifische Lizenzen variieren — holen Sie sich ein Angebot, das Ihrem spezifischen Budget entspricht.
  • PDFTrons leistungsstarke Technologie für Dokumentenanzeige und -bearbeitung für Rendering und Dokumentenverarbeitung auf Web-, Mobile- und Desktop-Plattformen bereitstellen
  • Bereit für Integration, OEM-Weitervertrieb und Unternehmen mit großen Dokumentvolumen oder einzigartigen Anforderungen
  • Mehrdomänen-Preisgestaltung und günstige mehrjährige Rabatte
  • Offline- und separat isolierter Betrieb unterstützt
  • Individuelle, umfassende Vertragsbedingungen
  • Beratungs- und Schulungsdienste

PDFTron-Kundenlizenzen werden auf Ihre Anwendungs- und Geschäftsanforderungen zugeschnitten. Die Preisgestaltung hängt von Ihrem Funktionsumfang ab.

class="content-img-align-center"> Pdftron Ocr Alternatives 8 related to PDFTron Pakete (kundenspezifische Lizenzen)

class="content__image-caption">

Die IronOCR Lite-Lizenz ist ein undefiniertes Paket, das einen Entwickler mit einem Jahr Support umfasst und etwa $799 kostet. Die IronOCR Professionell-Lizenz, einschließlich 10-Entwickler-Paketen und einem Jahr Support, kostet $999, während die PDFTron-Pakete undefiniert sind. Um ein Paket zu kaufen, müssen Sie das Support-Center kontaktieren, um ein Angebot zu erhalten.

Die IronOCR Lite- und Professional-Pakete umfassen OEM- oder SaaS-Dienste mit einer 5-Jahres-Support-Option. Die Lite-Version umfasst ein Ein-Entwickler-Paket mit 5 Jahren Support und SaaS- und OEM-Dienstleistungen, die $2,897 mit einer maßgeschneiderten Support-Option kosten. Die IronOCR Professional-Version umfasst ein 10-Entwickler-Paket mit 5 Jahren Support, SaaS- und OEM-Dienstleistungen und kostet $3,397. PDFTrons 10-Entwickler-Paket mit einem Jahr Support, SaaS und OEM-Dienstleistung hat keinen definierten Preis.

7.0 Fazit

IronOCR im Kontext des .NET Framework bietet Tesseract, das einfach zu verwenden ist mit der Unterstützung von Fotos und PDF-Dokumenten, die auf verschiedene Weise erreicht werden. Es bietet auch mehrere Einstellungen zur Verbesserung der Tesseract-OCR-Leistung. Eine Vielzahl von Sprachen wird unterstützt, mit der Möglichkeit, mehrere Sprachen in einer einzigen Operation zu haben. Besuchen Sie ihre Website, um mehr über die Tesseract-OCR zu erfahren.

PDFTron ist eine Softwareanwendung, die unterschiedliche Engines verwendet, um Bilder und PDF-Dokumente zu erkennen. Es bietet auch verschiedene Einstellungen zur Verbesserung der Leistung des OCR-Prozesses und die Möglichkeit, mehrere Sprachen auszuwählen. PDFTron hat Einschränkungen bei der Nutzung von Seitenumwandlungen. Es bietet auch verschiedene Preise für verschiedene Betriebssysteme.

IronOCR ist ein konkurrenzfähiges Softwareprodukt und kann eine höhere Genauigkeit als konkurrierende Marken bieten. Ähnliche Produkte haben manchmal versagt, minderwertige Bilder zu erkennen, was zu unbekannten Zeichen führt. Andererseits bietet IronOCR nicht nur genaue Ergebnisse, sondern ermöglicht uns auch, Barcode-Daten zu erkennen und den Wert von Barcodes aus Bildern zu lesen.

Die IronOCR-Pakete bieten zu einem einzigen Preis für alle Plattformen wettbewerbsfähige Lizenzierung und Unterstützung. Im Vergleich dazu sind die OCR-Produkte von PDFTron ausschließlich individuell ausgewählt, was tendenziell teurer ist. Die Preise variieren zwischen beiden Produkten, wobei IronOCR bei einem Preis von $799 beginnt, während aufgrund der individuellen Auswahl, PDFTrons Startpreis nicht definiert ist. Abschließend bietet IronOCR eine breitere Palette an Funktionen zu einem niedrigeren Preis.

Was warten Sie also noch? Die kostenlose Testversion ist für alle offen. Erhalten Sie die Lizenz hier und beginnen Sie sofort!

Hinweis:PDFTron OCR ist ein eingetragenes Warenzeichen seines jeweiligen Eigentümers. Diese Seite ist nicht verbunden mit, unterstützt von oder gesponsert von PDFTron OCR. Alle Produktnamen, Logos und Marken sind Eigentum ihrer jeweiligen Eigentümer. Vergleiche dienen nur zu Informationszwecken und spiegeln öffentlich zugängliche Informationen zum Zeitpunkt des Schreibens wider.

Häufig gestellte Fragen

Was ist Optische Zeichenerkennung (OCR) und warum ist sie wichtig?

Optische Zeichenerkennung (OCR) ist eine Technologie, die dazu verwendet wird, Papierdokumente oder Bilder in lesbaren Text umzuwandeln. Sie ist essenziell für Anwendungen in den Bereichen Recht, Wirtschaft und Wissenschaft und ermöglicht die Umwandlung von gescannten Dateien und PDFs in ihr ursprüngliches Textformat.

Wie kann ich die OCR-Funktionalität in eine C#-Anwendung integrieren?

Sie können die OCR-Funktionalität in eine C#-Anwendung mit IronOCR integrieren, das eine nahtlose Integration mit .NET-Anwendungen bietet und mehrere Sprachen und Barcode-Formate unterstützt.

Was sind die Installationsschritte für IronOCR?

IronOCR kann über Visual Studio mithilfe des NuGet-Paket-Managers installiert werden. Sie können auch die Visual Studio-Befehlszeile verwenden, direkt von der NuGet-Website herunterladen oder von der IronOCR-Website beziehen.

Was sind die wichtigsten Unterschiede zwischen PDFTron OCR und IronOCR?

Während PDFTron OCR ein separates Add-on-Modul erfordert und Vielseitigkeit in Dokumentformaten bietet, bietet IronOCR eine überlegene Integration mit .NET, unterstützt mehr Sprachen und bietet wettbewerbsfähige Preise mit Fokus auf Benutzerfreundlichkeit.

Wie geht IronOCR mit minderwertigen Scans um?

IronOCR wurde entwickelt, um minderwertige Scans zu korrigieren, und bietet eine präzise Texterkennung und strukturierten Datenausgabe, selbst wenn die Originalbilder nicht von hoher Qualität sind.

Welche Sprachunterstützung bietet IronOCR?

IronOCR unterstützt 125 Sprachen und ist damit eine vielseitige Option für globale Anwendungen, die OCR-Funktionalität erfordern.

Kann IronOCR für Barcode-Erkennung verwendet werden?

Ja, IronOCR unterstützt nicht nur das Lesen von Text, sondern auch von QR-Codes und Barcodes aus PDFs und Bildern, was seine Nützlichkeit für verschiedene Anwendungen erhöht.

Was sind einige häufige Anwendungsfälle für OCR-Technologie?

OCR-Technologie wird häufig verwendet, um gescannte juristische Dokumente zu konvertieren, die Dateneingabe zu automatisieren, PDFs durchsuchbar zu machen und sehbehinderten Nutzern zu helfen, indem Text in Audio umgewandelt wird.

Wie wird IronOCR im Vergleich zu PDFTron OCR bepreist?

IronOCR bietet einfache unbefristete Lizenzen mit Optionen für verschiedene Benutzeranforderungen, während die Preise von PDFTron OCR auf spezifischen Anwendungsanforderungen basieren und oft zu höheren Kosten führen.

Was ist der Prozess zur Umwandlung von Bildern in Text mit IronOCR?

Mit IronOCR können Sie Bilder in Text umwandeln, indem Sie seine OCR-Fähigkeiten innerhalb einer .NET-Anwendung nutzen und dabei seine Unterstützung für mehrere Bildformate und Sprachen ausnutzen.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen