IronOCR Merkmale
IronOCR ist eine .NET-Bibliothek, die es Entwicklern ermöglicht, Text oder Barcodes von Bildern zu scannen und zu lesen.
Kompatibilität
.NET-Sprachen
- C# (Tutorial API-Referenz)
- Scannen und Lesen von Texten oder Barcodes aus Bildern(jpg, png, gif, tiff, bmp) in C#.
- VB.NET
- Scannen und Lesen von Texten oder Barcodes aus Bildern(jpg, png, gif, tiff, bmp) in VB.NET.
F#
- Scannen und Lesen von Text oder Barcodes aus Bildern(jpg, png, gif, tiff, bmp) in F#.
Plattformen
- .NET 5, 6, 7 und 8 (Tutorial)
- IronOCR for .NET ist für .NET 5, 6, 7 und 8 verfügbar.
.NET Core 2 und 3 (Tutorial)
IronOCR ist für .NET Core 2 und 3 verfügbar.
- Die aktuelle Version unterstützt .NET Core auf Linux-, Unix- und macOS-Client-Betriebssystemen sowie Mono.
- Eine zukünftige Version wird MAUI und Xamarin unterstützen
- .NET-Standard 2+ (API-Referenz)
- IronOCR ist kompatibel mit .NET-Standard 2 und aufwärts.
.NET-Framework 4.6.2+ (Code-Beispiel API-Referenz)
- Scannen und Lesen von Texten oder Barcodes aus Bildern mit .NET-Framework 4.6.2 und höher.
App-Typen
Konsole, Web und Desktop (Tutorial API-Referenz)
- Erstellen Sie mit IronOCR Anwendungen für Web, Desktop und Konsole.
Betriebssysteme
IDEs
- Microsoft Visual Studio (Tutorial)
- Jetbrains ReSharper und Rider
Zertifizierung
Microsoft Authenticode
- DigiCert Trusted G4 Code Signing RSA4096 SHA384 2021 CA1
OCR-Engine
Zugrunde liegende OCR-Engine
- Tesserakt 5 (Tutorial Code-Beispiel)
- Tesseract ist eine quelloffene Texterkennung(OCR) engine, verfügbar unter der Apache 2.0 Lizenz. Eine der genauesten und schnellsten Bibliotheken ist für C#.NET verfügbar. Derzeit ist Tesseract 5 die stabilste Version.
Detaillierte Konfiguration(Code-Beispiel)
Das Objekt
IronTesseract.Configuration
ermöglicht den Zugriff auf die zugrundeliegende Tesseract-API in C# / .NET, um das Setup für fortgeschrittene Benutzer zu konfigurieren.Die Einrichtung kann dazu beitragen, die Ausgabe nach der OCR zu verbessern.
- Um die OCR-Geschwindigkeit zu verbessern, prüfen Sie bittedieses Codebeispiel für die schnelle OCR-Konfiguration.
Internationale Sprachen
- 25 Sprachen (Liste Code-Beispiel)
- Hohe, mittlere und schnelle Qualität für die meisten Sprachen (Code-Beispiel)
- Benutzerdefinierte Sprachen (Code-Beispiel)
- Schulung zu benutzerdefinierten Schriften (Anleitungen)
Lesen von Text und Barcode
- Text und Zahlen (Code-Beispiel)
- Mehrere Sprachen auf einmal (Anleitungen Code-Beispiel)
- Barcode (Über 20 Formate) and QR Code (Anleitungen Code-Beispiel)
Spezielle Dokumente (Anleitungen)
Diese Methode nutzt maschinelles Lernen, um die Texterkennung zu verbessern.
- Dokument
- Optimiert für das Lesen von gescannten Dokumenten oder Fotos von Papierdokumenten mit viel Text.
- Nummernschild
- Optimiert für das Lesen von Nummernschildern aus Fotos.
- Reisepass
- Optimiert für das Lesen und Extrahieren von Passinformationen aus Fotos durch Scannen der maschinenlesbaren Zone(MRZ) inhalt.
- Foto
- Optimiert für das Lesen von Bildern, die schwer zu lesenden Text enthalten.
Bildschirmfoto
- Optimiert für das Lesen von Screenshots, die schwer zu lesenden Text enthalten.
Gleichzeitigkeit
- Einzel- und Multithreading (Anleitungen Code-Beispiel)
- Async-Unterstützung (Anleitungen API-Referenz)
- Token abbrechen (Code-Beispiel)
- Ermöglicht es den Benutzern, den aktuellen Thread für einen bestimmten Zeitraum in Millisekunden zu unterbrechen, wenn eine große Eingabedatei gelesen wird und das Programm oder die Anwendung nicht weiterläuft.
Zeitüberschreitung (Code-Beispiel)
- Angabe eines optionalen Timeouts in Millisekunden, nach dem die OCR-Lesung abgebrochen wird.
Computer Vision
- Nutzen Sie Computer Vision, um Text auf der Grundlage unserer hochentwickelten, trainierten Modelle zu finden. IronOCR nutzt OpenCV, um mit Hilfe von Computer Vision Bereiche zu erkennen, in denen Text in einem Bild vorhanden ist. Dies ist nützlich für Bilder, die viel Rauschen enthalten, Bilder mit Text an vielen verschiedenen Stellen und Bilder, bei denen der Text verzerrt ist. Use of computer vision in IronOCR will determine where text regions exists and then use Tesseract to attempt to read those regions.
OCR-Eingabe
Lesen von vielen Formaten
- Bilder (jpg, png, gif, tiff, bmp) (Anleitungen Code-Beispiel)
- Multi Page und Frame tiff und gif Dateien (Anleitungen Code-Beispiel)
- System.Drawing-Objekte (Anleitungen Code-Beispiel)
- Ströme (Anleitungen Code-Beispiel)
- PDFs (Anleitungen Code-Beispiel)
Filter
- Filter-Assistent (Code-Beispiel API-Referenz)
- Wenn Sie nicht wissen, welcher Filter auf das Bild angewendet werden soll, stellt der Filter-Assistent eine Liste von Filtern zur Verfügung, die für OcrInput geeignet sind, wobei ein Brute-Force-Ansatz verwendet wird, der die Kombination mit dem höchsten Vertrauen liefert.
OCR-Bildfilter (Anleitungen Tutorial Code-Beispiel)
schärfen (API-Referenz)
* Schärft unscharfe OCR-Dokumente. Verflacht Alphakanäle zu Weiß.
enhanceResolution (API-Referenz)
* Verbessert die Auflösung von Bildern niedriger Qualität.
denoise (API-Referenz)
* Entfernt digitales Rauschen. Dieser Filter sollte nur verwendet werden, wenn Rauschen zu erwarten ist. Verflacht Alphakanäle zu Weiß.
dilatieren (API-Referenz)
* Morphologie für Fortgeschrittene. mit _Dilatation_ werden Pixel zu den Grenzen von Objekten in einem Bild hinzugefügt. Gegenüber von Erode
- aussterben (API-Referenz)
- Morphologie für Fortgeschrittene. mit Erosion werden Pixel an Objektgrenzen entfernt. Gegenteil von Dilatieren
Bildausrichtung fixieren (Anleitungen Tutorial Code-Beispiel)
drehen (Tutorial API-Referenz)
* Dreht Bilder um eine bestimmte Gradzahl im Uhrzeigersinn. Für eine Drehung gegen den Uhrzeigersinn verwenden Sie negative Zahlen.
deskew (Tutorial API-Referenz)
* Dreht ein Bild so, dass es richtig herum und orthogonal ist. Dies ist für OCR sehr nützlich, da die Toleranz von Tesseract für schiefe Scans bis zu 5 Grad betragen kann
- skala (Tutorial API-Referenz)
- Skaliert OcrInput-Seiten proportional.
Bildfarben korrigieren (Anleitungen Tutorial Code-Beispiel)
binarisieren (Tutorial API-Referenz)
* Dieser Bildfilter macht jedes Pixel schwarz oder weiß, ohne einen Mittelweg zu finden. Kann die OCR-Leistung in Fällen mit sehr geringem Kontrast zwischen Text und Hintergrund verbessern.
toGrayScale (API-Referenz)
* Dieser Bildfilter verwandelt jedes Pixel in einen Graustufenwert. Es ist unwahrscheinlich, dass die OCR-Genauigkeit verbessert wird, aber es kann die Geschwindigkeit erhöhen.
invertieren (Tutorial API-Referenz)
* Invertiert jede Farbe. Z. B. Weiß wird schwarz: Schwarz wird weiß.
ersetzenFarbe (API-Referenz)
* Ersetzt eine Farbe innerhalb eines Bildes durch eine andere Farbe mit einem bestimmten Schwellenwert.
textFarbeWählen (API-Referenz)
* Ersetzt eine Farbe innerhalb eines Bildes durch eine andere Farbe mit einem bestimmten Schwellenwert.
Anlegen einer Anbauregion
CropRectangle (Code-Beispiel API-Referenz)
- Zeichnen eines Rechtecks mit der angegebenen Koordinate über einen OcrInput.
OCR-Ergebnis
Einfache Datenausgabe
- .NET-Text-Strings
- Barcode und QR-Daten
- Bilder
Strukturierte Datenausgabe
- Seiten
- Blöcke
- Paragraphen
- Zeilen
- Wörter
- Zeichen
Dokumente exportieren
Durchsuchbare PDFs (Anleitungen Tutorial)
- PDF in durchsuchbares PDF(Code-Beispiel)
- TIFF in durchsuchbares PDF(Code-Beispiel)
- hOCR-Ausfuhr (Anleitungen Tutorial)
- HTML-Ausfuhr
- Bild einer beliebigen Seite oder eines Textelements
- Barcode oder QR-Code als Bild
Text auf einer Seite zur Fehlersuche hervorheben
- Zeichnen von roten Kästen um Zeichen/Wörter/Zeilen/Absätze, die als Hervorhebung erkannt werden, und Speichern als .png für die Fehlersuche.
Status und Analytik
- OCR-Fortschrittsverfolgung (Code-Beispiel)
- Ergebnis Zuversicht (Anleitungen)