IronOCR Merkmale

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR ist eine .NET-Bibliothek, die es Entwicklern ermöglicht, Text oder Barcodes von Bildern zu scannen und zu lesen.

Kompatibilität

.NET-Sprachen

  • C# (Tutorial API-Referenz)
    • Scannen und Lesen von Texten oder Barcodes aus Bildern(jpg, png, gif, tiff, bmp) in C#.
  • VB.NET
    • Scannen und Lesen von Texten oder Barcodes aus Bildern(jpg, png, gif, tiff, bmp) in VB.NET.
  • F#
    • Scannen und Lesen von Text oder Barcodes aus Bildern(jpg, png, gif, tiff, bmp) in F#.

Plattformen

  • .NET 5, 6, 7 und 8 (Tutorial)
    • IronOCR for .NET ist für .NET 5, 6, 7 und 8 verfügbar.
  • .NET Core 2 und 3 (Tutorial)
    • IronOCR ist für .NET Core 2 und 3 verfügbar.
    • Die aktuelle Version unterstützt .NET Core auf Linux-, Unix- und macOS-Client-Betriebssystemen sowie Mono.
    • Eine zukünftige Version wird MAUI und Xamarin unterstützen
  • .NET-Standard 2+ (API-Referenz)
    • IronOCR ist kompatibel mit .NET-Standard 2 und aufwärts.
  • .NET-Framework 4.6.2+ (Code-Beispiel API-Referenz)
    • Scannen und Lesen von Texten oder Barcodes aus Bildern mit .NET-Framework 4.6.2 und höher.

App-Typen

  • Konsole, Web und Desktop (Tutorial API-Referenz)
    • Erstellen Sie mit IronOCR Anwendungen für Web, Desktop und Konsole.

Betriebssysteme

IDEs

  • Microsoft Visual Studio (Tutorial)
  • Jetbrains ReSharper und Rider

Zertifizierung

  • Microsoft Authenticode
    • DigiCert Trusted G4 Code Signing RSA4096 SHA384 2021 CA1

OCR-Engine

Zugrunde liegende OCR-Engine

  • Tesserakt 5 (Tutorial Code-Beispiel)
    • Tesseract ist eine quelloffene Texterkennung(OCR) engine, verfügbar unter der Apache 2.0 Lizenz. Eine der genauesten und schnellsten Bibliotheken ist für C#.NET verfügbar. Derzeit ist Tesseract 5 die stabilste Version.
  • Detaillierte Konfiguration(Code-Beispiel)
    • Das Objekt IronTesseract.Configuration ermöglicht den Zugriff auf die zugrundeliegende Tesseract-API in C# / .NET, um das Setup für fortgeschrittene Benutzer zu konfigurieren.
    • Die Einrichtung kann dazu beitragen, die Ausgabe nach der OCR zu verbessern.
    • Um die OCR-Geschwindigkeit zu verbessern, prüfen Sie bittedieses Codebeispiel für die schnelle OCR-Konfiguration.

Internationale Sprachen

Lehrgang

Lesen von Text und Barcode

Spezielle Dokumente (Anleitungen)

Diese Methode nutzt maschinelles Lernen, um die Texterkennung zu verbessern.

  • Dokument
    • Optimiert für das Lesen von gescannten Dokumenten oder Fotos von Papierdokumenten mit viel Text.
  • Nummernschild
    • Optimiert für das Lesen von Nummernschildern aus Fotos.
  • Reisepass
    • Optimiert für das Lesen und Extrahieren von Passinformationen aus Fotos durch Scannen der maschinenlesbaren Zone(MRZ) inhalt.
  • Foto
    • Optimiert für das Lesen von Bildern, die schwer zu lesenden Text enthalten.
  • Bildschirmfoto
    • Optimiert für das Lesen von Screenshots, die schwer zu lesenden Text enthalten.

Gleichzeitigkeit

  • Einzel- und Multithreading (Anleitungen Code-Beispiel)
  • Async-Unterstützung (Anleitungen API-Referenz)
  • Token abbrechen (Code-Beispiel)
    • Ermöglicht es den Benutzern, den aktuellen Thread für einen bestimmten Zeitraum in Millisekunden zu unterbrechen, wenn eine große Eingabedatei gelesen wird und das Programm oder die Anwendung nicht weiterläuft.
  • Zeitüberschreitung (Code-Beispiel)
    • Angabe eines optionalen Timeouts in Millisekunden, nach dem die OCR-Lesung abgebrochen wird.

Computer Vision

Anleitungen API-Referenz

  • Nutzen Sie Computer Vision, um Text auf der Grundlage unserer hochentwickelten, trainierten Modelle zu finden. IronOCR nutzt OpenCV, um mit Hilfe von Computer Vision Bereiche zu erkennen, in denen Text in einem Bild vorhanden ist. Dies ist nützlich für Bilder, die viel Rauschen enthalten, Bilder mit Text an vielen verschiedenen Stellen und Bilder, bei denen der Text verzerrt ist. Use of computer vision in IronOCR will determine where text regions exists and then use Tesseract to attempt to read those regions.

OCR-Eingabe

Codebeispiel

Lesen von vielen Formaten

Filter

  • Filter-Assistent (Code-Beispiel API-Referenz)
    • Wenn Sie nicht wissen, welcher Filter auf das Bild angewendet werden soll, stellt der Filter-Assistent eine Liste von Filtern zur Verfügung, die für OcrInput geeignet sind, wobei ein Brute-Force-Ansatz verwendet wird, der die Kombination mit dem höchsten Vertrauen liefert.
  • OCR-Bildfilter (Anleitungen Tutorial Code-Beispiel)
    • schärfen (API-Referenz)
      • Schärft unscharfe OCR-Dokumente. Verflacht Alphakanäle zu Weiß.
    • enhanceResolution (API-Referenz)
      • Verbessert die Auflösung von Bildern niedriger Qualität.
    • denoise (API-Referenz)
      • Entfernt digitales Rauschen. Dieser Filter sollte nur verwendet werden, wenn Rauschen zu erwarten ist. Verflacht Alphakanäle zu Weiß.
    • dilatieren (API-Referenz)
      • Morphologie für Fortgeschrittene. mit Dilatation werden Pixel zu den Grenzen von Objekten in einem Bild hinzugefügt. Gegenüber von Erode
    • aussterben (API-Referenz)
      • Morphologie für Fortgeschrittene. mit Erosion werden Pixel an Objektgrenzen entfernt. Gegenteil von Dilatieren
  • Bildausrichtung fixieren (Anleitungen Tutorial Code-Beispiel)
    • drehen (Tutorial API-Referenz)
      • Dreht Bilder um eine bestimmte Gradzahl im Uhrzeigersinn. Für eine Drehung gegen den Uhrzeigersinn verwenden Sie negative Zahlen.
    • deskew (Tutorial API-Referenz)
      • Dreht ein Bild so, dass es richtig herum und orthogonal ist. Dies ist für OCR sehr nützlich, da die Toleranz von Tesseract für schiefe Scans bis zu 5 Grad betragen kann
    • skala (Tutorial API-Referenz)
      • Skaliert OcrInput-Seiten proportional.
  • Bildfarben korrigieren (Anleitungen Tutorial Code-Beispiel)
    • binarisieren (Tutorial API-Referenz)
      • Dieser Bildfilter macht jedes Pixel schwarz oder weiß, ohne einen Mittelweg zu finden. Kann die OCR-Leistung in Fällen mit sehr geringem Kontrast zwischen Text und Hintergrund verbessern.
    • toGrayScale (API-Referenz)
      • Dieser Bildfilter verwandelt jedes Pixel in einen Graustufenwert. Es ist unwahrscheinlich, dass die OCR-Genauigkeit verbessert wird, aber es kann die Geschwindigkeit erhöhen.
    • invertieren (Tutorial API-Referenz)
      • Invertiert jede Farbe. Z. B. Weiß wird schwarz: Schwarz wird weiß.
    • ersetzenFarbe (API-Referenz)
      • Ersetzt eine Farbe innerhalb eines Bildes durch eine andere Farbe mit einem bestimmten Schwellenwert.
    • textFarbeWählen (API-Referenz)
      • Ersetzt eine Farbe innerhalb eines Bildes durch eine andere Farbe mit einem bestimmten Schwellenwert.

Anlegen einer Anbauregion

OCR-Ergebnis

Einfache Datenausgabe

Anleitungen Code-Beispiel

  • .NET-Text-Strings
  • Barcode und QR-Daten
  • Bilder

Strukturierte Datenausgabe

Anleitungen Code-Beispiel

  • Seiten
  • Blöcke
  • Paragraphen
  • Zeilen
  • Wörter
  • Zeichen

Dokumente exportieren

Text auf einer Seite zur Fehlersuche hervorheben

  • Zeichnen von roten Kästen um Zeichen/Wörter/Zeilen/Absätze, die als Hervorhebung erkannt werden, und Speichern als .png für die Fehlersuche.

Status und Analytik