Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Tesseract wurde ursprünglich zwischen 1985 und 1994 von HP Laboratories Bristol und HP Co. entwickelt. in Greeley, Colorado. Weitere Verbesserungen wurden 1996 vorgenommen, um es auf Windows umzustellen, und 1998 wurde es in C++ umgeschrieben. HP stellte Tesseract 2005 als Open Source zur Verfügung. Google arbeitet seit 2006 mit der Software.
Tesseract OCR ist ein Tool, das in die Kategorie der Bildanalyse-APIs des Google Tech Stacks fällt. Es kann unübersichtliche Hintergründe automatisch entfernen und PDF-Dateien erzeugen, die mit denen von Scannern vergleichbar sind. Tesseract verwendet eine hochpräzise optische Zeichenerkennungstechnologie, die gescannte Papierdokumente in durchsuchbare digitale Dateien umwandeln kann. Es kann Text und Zeichen aus Kamerafotos, digitalen Bildern und gescannten PDF-Dokumenten extrahieren, die mehrere Seiten umfassen. Außerdem können PDF-Dateien, die getippten oder gedruckten Text enthalten, in computercodierten Text umgewandelt werden.
Es gibt andere OCR-Software (sowohl quelloffen als auch proprietär, webdienstbasiert) die alle Text aus Bilddateien und PDFs extrahieren können. In diesem Artikel werden wir einige OCR-Tools untersuchen, die Alternativen zu Tesseract OCR darstellen.
ABBYY FineReader PDF wurde von ABBYY entwickelt und ist eine Software zur optischen Zeichenerkennung, die Bilddokumente in PDF-Dateien umwandelt (wie Fotos, Scans und PDF-Dateien)und Bildschirmaufnahmen in bearbeitbare Dateiformate wie Microsoft Word, Microsoft Excel, Microsoft PowerPoint, Rich Text Format, HTML, PDF/A, durchsuchbares PDF, CSV und Text (einfacher Text).
ABBYY FineReader PDF kann PDF-Dateien direkt aus Papierdokumenten, aus mehr als 25 verschiedenen Dateitypen oder durch Veröffentlichung auf einem PDF-Drucker aus nahezu jedem Programm erstellen. Die Langzeitarchivierung ist für PDF/A-1 bis PDF/A-3 möglich, und PDF/UA sorgt dafür, dass die Inhalte auch bei Verwendung von Hilfsmitteln wie Bildschirmlesegeräten zugänglich sind.
Darüber hinaus ermöglicht ABBYY FineReader PDF Experten, am digitalen Arbeitsplatz so effizient wie möglich zu arbeiten. ABBYY FineReader integriert gescannte Dokumente in digitale Workflows und spart so Zeit und Mühe bei der Verwaltung und Vervollständigung von Dokumenten. Sie brauchen Ihre PDF-Datei nicht zu konvertieren, um den Text, die Tabellen oder das gesamte Layout zu bearbeiten. Unabhängig davon, wie das Dokument erstellt wurde - ob digital oder direkt von einem Papierdokument - kann diese Software jedes Dokument einfach und methodisch verarbeiten. Die Software kann auch editierbare PDF-Dateien erstellen.
Eine Desktop-Version von ABBYY FineReader ist für Windows, Linux und macOS verfügbar.
Als maschinelles Lernen (ML) webservice extrahiert Amazon Textract Text, Handschrift, Tabellen und andere Daten aus jedem gescannten Dokument. Sie nutzt Deep Learning, um Inhalte aus gescannten Dokumenten wie PDFs, Fotos, Tabellen und Formularen präzise und automatisch zu extrahieren. Anschließend gibt Amazon Textract die Informationen in einem editierbaren, organisierten Dateiformat aus.
Stellen Sie sich ein Szenario vor, in dem ein Unternehmen relevante Informationen aus den Rechnungsausdrucken vieler Firmen in Excel-Tabellen übertragen muss. Üblicherweise wird diese Aufgabe von Dateneingabepersonal manuell erledigt, was sich jedoch oft als unorganisiert, zeitaufwändig und fehleranfällig erweist. Darüber hinaus verbringen andere Unternehmen, die OCR-Softwarelösungen verwenden, oft Stunden damit, ihre Tools zu konfigurieren, um Daten aus ihren Dokumenten zu extrahieren (die häufig aktualisiert werden müssen, wenn sich ihr Format ändert).
Mit Textract brauchen Unternehmen nur unsere Rechnungen in den Webservice hochzuladen, und sie erhalten den Text, die Formulare, die Schlüssel-Wert-Paare und die Tabellen dieser Dokumente in einem besser organisierten Format. Dadurch entfällt die Notwendigkeit manueller, zeitaufwändiger und teurer Dateneingabeprozesse.
Darüber hinaus können Sie mit Amazon OCR auf einfache Weise Bild- und Videoanalysen in Ihre Anwendungen integrieren, indem Sie eine bewährte, hoch skalierbare Deep-Learning-Technologie verwenden, für die keine Kenntnisse im Bereich maschinelles Lernen erforderlich sind.
iText ist ein OCR-Programm für Endanwender, das gescannte Bilder mit mehreren branchenführenden OCR-Engines verarbeitet. Unter den Bedingungen der Open-Source AGPL können Sie iText 7 Core und eine bestimmte Anzahl von Add-ons frei verwenden. Als Alternativen können Sie auch aus einer Vielzahl von kommerziellen Lizenzalternativen wählen.
Die iText Group, zu deren Produkten die iText 7 Suite und iText DITO gehören, ist ein weltweit führender Anbieter von PDF-Technologie. Das Unternehmen stellt hochmoderne, preisgekrönte PDF-Software her, die von Millionen von Kunden auf der ganzen Welt zur Erstellung digitaler Dokumente für verschiedene Zwecke verwendet wird, z. B. für Rechnungen, Kreditkartenabrechnungen, mobile Bordkarten, die Archivierung von Rechtsdokumenten und vieles mehr. Diese Software ist sowohl als Open-Source- als auch als kommerzielle Software erhältlich.
Die iText Group bietet auch die iText 7 Suite an, ein komplettes Open-Source-PDF-SDK, das iText 7 Core zusammen mit optionalen Add-ons für maximale Freiheit und Produktivität enthält.
Die OCR-Technologie von Tencent Cloud kann Text in Fotos automatisch erkennen und identifizieren. Die Zuverlässigkeit und durchschnittliche Genauigkeit liegt bei gedrucktem Text bei über 95 % und bei handschriftlichem Material bei 90 %. Die Algorithmen für die Dokumentenanalyse und Texterkennung der OCR-Technologie wurden vom Tencent YouTu Lab entwickelt. Sie kann in Situationen mit perspektivischer Verzerrung, unregelmäßiger Beleuchtung, teilweiser Verdeckung und vielem mehr eingesetzt werden. Es unterstützt sowohl den Hoch- als auch den Querformatmodus. Mit verbesserter Genauigkeit kann die Technologie zwischen chinesischem Text, englischem Text, chinesischem/englischem Text, Ziffern und Sonderzeichen unterscheiden. Es bietet Entwicklern eine Vielzahl von APIs, die direkt aufgerufen werden können, sowie einfach zu verwendende SDKs.
IronOCR ist eine OCR-Texterkennungs- und Dokumentenscan-App, die sehr genau und effizient ist. Softwareentwickler können mit IronOCR for .NET Text aus Bildern und PDFs in .NET-Anwendungen und Webseiten lesen. Die Software hilft beim Scannen von Text und Barcodes, unterstützt eine Vielzahl von Fremdsprachen und erzeugt Ausgaben als reinen Text oder strukturierte Daten. Web-, Konsolen-, MVC- und eine Vielzahl von .NET-Desktop-Anwendungen können alle die OCR-Bibliothek von Iron Software nutzen. Bei kommerzieller Nutzung wird neben den entsprechenden Lizenzen auch direkter Support durch das Entwicklungsteam angeboten. IronOCR integriert Funktionen zur Dokumentenverarbeitung wie Bildkonvertierung, -erstellung, -bearbeitung, -manipulation, -komprimierung und -verbesserung schnell in Anwendungen.
Nachfolgend finden Sie den Beispielcode für die Durchführung der OCR an einer Bilddatei.
using IronOcr;
var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput(@"images\image.png"))
{
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput(@"images\image.png"))
{
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract() ' nothing to configure
Using Input = New OcrInput("images\image.png")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Klicken Sie auf hier für weitere Tutorials zu IronOCR.
Tesseract ist einfach zu bedienen und unterstützt Bilder und PDF-Dokumente für eine Vielzahl von Methoden. Sie wird von IronOCR im Rahmen des .NET-Frameworks bereitgestellt. Zusätzlich bietet es eine Reihe von Parametern, die die Funktionalität der Tesseract OCR-Bibliothek erweitern. Die Möglichkeit, mehrere Sprachen gleichzeitig zu verwenden, wird für eine breite Palette von Sprachen angeboten. Die IronOCR-Pakete bieten wettbewerbsfähige Lizenzierung und Support für alle Plattformen zu einem einzigen Preis. Außerdem erhalten Sie ein Jahr lang kostenlose Updates, Funktionserweiterungen und Support durch unser Entwicklungsteam. IronOCR ist eine der besten Alternativen zu Tesseract, die von Google entwickelt wurde, und kann mit nur wenigen Zeilen Code leicht implementiert werden.
IronOCR wird mit der lizenzfreien Weiterverbreitungsabdeckung geliefert, die für Softwarepakete, SaaS und OEM erforderlich ist. Andere OCR-Produkte sind dagegen alle vollständig kundenspezifisch und in der Regel teurer. Beide Produkte haben unterschiedliche Preispunkte, wobei IronOCR bei $749 beginnt. Hier finden Sie weitere Einzelheiten zur Lizenzierung und Preisgestaltung. Kurz gesagt, IronOCR bietet mehr Funktionen zu insgesamt niedrigeren Kosten.
9 .NET API-Produkte für Ihre Bürodokumente