In diesem Tutorial untersuchen wir, wie man Tesseract OCR mit IronOCR auf Windows 10 und 11 verwendet. Der Prozess beginnt mit der Erstellung einer Konsolenanwendung in Visual Studio 2022. Um OCR in Ihrem Projekt durchzuführen, müssen Sie die IronOCR-Bibliothek installieren, die über den NuGet-Paket-Manager, die NuGet-Konsole oder die NuGet-Website hinzugefügt werden kann. Es ist wichtig sicherzustellen, dass die Bibliothek auf dem neuesten Stand ist.
Einmal eingerichtet, wechseln wir zur Programm-CS-Datei, wo die IronOCR-Bibliothek importiert wird. Ein Objekt von Iron Tesseract wird erstellt, und der OCR-Eingang beinhaltet das Bereitstellen eines Pfads zum ausgewählten Bild. Dieses Bild wurde aufgrund seiner Unschärfe und kleinen Größe ausgewählt, um die Fähigkeiten von Iron OCR zu testen. Das Tutorial demonstriert die Nutzung der verbesserten Auflösungsfunktion zur Verbesserung der Bildqualität und der Entrauschungsfunktion zur Entfernung von Bildunschärfe. Wenn das Bild gedreht ist, kann die dsq-Funktion seine ursprüngliche Position wiederherstellen.
Nach der Vorbereitung des Bildes liest die Read-Funktion das Eingabebild und gibt den extrahierten Text auf der Konsole aus. Das Ausführen des Projekts zeigt die Fähigkeit von IronOCR, selbst aus verschwommenen Bildern mit nahezu perfekter Genauigkeit exakten Text zu extrahieren.
Das Tutorial schließt mit der Empfehlung von Iron OCR für hochpräzise OCR-Aufgaben ab und betont seine Effektivität bei der Verarbeitung anspruchsvoller Bilder. Unterstützung steht für jede benötigte Hilfe zur Verfügung. Diese Anleitung stellt sicher, dass Benutzer die OCR-Technologie mit Vertrauen in ihre Projekte implementieren und davon profitieren können.
Weiterführende Literatur: Wie man Tesseract OCR für .NET auf Windows verwendet