Zum Fußzeileninhalt springen
VERWENDUNG VON IRONOCR

OCR C# GitHub-Integration: Texterkennungs-Apps mit IronOCR erstellen

IronOCR vereinfacht die OCR-Integration in C# GitHub-Projekte durch die Bereitstellung einer einzigen DLL-Lösung mit 99,8% Genauigkeit, integrierter Vorverarbeitung und Unterstützung für mehr als 125 Sprachen, wodurch die komplexe Konfiguration, die bei herkömmlichen Tesseract-Implementierungen erforderlich ist, entfällt.

Starten Sie jetzt mit IronOCR.
green arrow pointer

Wenn Sie ein C#-Entwickler sind, der Tesseract OCR auf GitHub erkundet, suchen Sie wahrscheinlich nach mehr als nur Code. Sie möchten eine Bibliothek, die tatsächlich einsatzbereit ist, mit ausführbaren Beispielen geliefert wird und eine aktive Community im Hintergrund hat. Zuverlässige Integration und solide Versionskontrolle sind genauso wichtig.

Hier kommt IronOCR ins Spiel. In diesem Leitfaden zeige ich Ihnen, wie Sie IronOCR in Ihre GitHub-Projekte einbinden, um die Texterkennung in Bildern und PDFs problemlos zu handhaben. Egal ob Sie einfachen Text erfassen, strukturierte Wörter und Zeilen extrahieren oder sogar durchsuchbare PDFs zur Archivierung erstellen möchten – IronOCR bietet Ihnen die passende Lösung. Die umfassenden Funktionen der Bibliothek unterstützen alles von der Barcode-Erkennung bis zur mehrsprachigen OCR .

Wie fange ich mit IronOCR und GitHub an?

IronOCR zeichnet sich als umfassende OCR-Lösung aus, die nahtlos mit GitHub-basierten Entwicklungs-Workflows und .NET Core-Projekten zusammenarbeitet. Im Gegensatz zu rohen Tesseract-Implementierungen, die eine komplexe Konfiguration erfordern, bietet IronOCR eine verfeinerte API, die Sie in wenigen Minuten zum Laufen bringt. Für diejenigen, die neu in den Konzepten der optischen Texterkennung sind, deckt IronOCRs umfassende Dokumentation alles ab, von der grundlegenden Textextraktion bis zur fortschrittlichen Bildbearbeitung. Die Bibliothek beinhaltet integrierte Unterstützung für Bildfilter und OCR-Optimierungstechniken .

Welche Installationsmethode soll ich verwenden?

Beginnen Sie mit der Installation von IronOCR über den NuGet-Paket-Manager:

Install-Package IronOcr

Das NuGet-Paket-Manager-Fenster in Visual Studio zeigt die Suchergebnisse für das IronOCR-Paket mit verschiedenen verfügbaren Sprachpaketen zur Installation an.

NuGet Mit NuGet installieren

PM >  Install-Package IronOcr

Schauen Sie sich IronOCR auf NuGet für eine schnelle Installation an. Mit über 10 Millionen Downloads transformiert es die PDF-Entwicklung mit C#. Sie können auch das DLL oder den Windows Installer herunterladen.

Für fortgeschrittene Installationsszenarien konsultieren Sie bitte den NuGet-Paketleitfaden . Wenn Sie auf bestimmten Plattformen bereitstellen, schauen Sie sich die Anleitungen für Windows , Linux , macOS oder auch Docker-Container an.

Wo finde ich Beispielcode?

IronOCR unterhält mehrere GitHub-Repositories mit Beispielen und Tutorials. Das offizielle IronOCR Examples Repository bietet Implementierungen aus der Praxis, während das Image to Text Tutorial Repository praktische Anwendungsfälle demonstriert, die Sie klonen und modifizieren können. Diese Repositories zeigen OCR mit Strichcodelesen, Unterstützung für mehrere Sprachen und PDF-Verarbeitung. Dank der regelmäßig auf NuGet veröffentlichten Pakete haben Sie immer Zugriff auf die neuesten stabilen Versionen. Im Demo-Bereich finden Sie weitere interaktive Beispiele.

Flussdiagramm der OCR-Verarbeitungspipeline: GitHub-OCR-Repository → IronOCR-Projekt → OCR-Verarbeitung → Extrahierter Text

Wie erstelle ich mein erstes OCR-Projekt auf GitHub?

Lassen Sie uns eine umfassende OCR-Anwendung bauen, die sich für die Freigabe auf GitHub eignet. Erstellen Sie in Visual Studio (oder Ihrer bevorzugten IDE) eine neue Konsolenanwendung mit dieser Projektstruktur, die den Best Practices für die OCR-Entwicklung entspricht:

Welche Projektstruktur sollte ich verwenden?

MyOcrProject/
├── src/
│   └── OcrProcessor.cs
├── images/
│   └── sample-invoice.jpg
├── .gitignore
├── README.md
└── MyOcrProject.csproj

Diese Struktur unterstützt verschiedene Eingabeformate , darunter JPG, PNG, TIFF und BMP . IronOCR verarbeitet mehrseitige TIFF- oder GIF-Dateien automatisch.

Wie implementiere ich den OCR-Verarbeitungscode?

Hier ist ein vollständiges C#-Codebeispiel eines OCR-Prozessors, das die wichtigsten Funktionen von IronOCR demonstriert, darunter Bildvorverarbeitung , Textextraktion und Barcode-Erkennung :

using IronOcr;
using System;
using System.IO;
namespace MyOcrProject
{
    public class OcrProcessor
    {
        private readonly IronTesseract _ocr;
        public OcrProcessor()
        {
            _ocr = new IronTesseract();
            // Configure for optimal accuracy
            _ocr.Configuration.ReadBarCodes = true;
            _ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;
            _ocr.Language = OcrLanguage.English;
        }
        public void ProcessDocument(string imagePath)
        {
            using var input = new OcrInput();
            // Load and preprocess the image
            input.LoadImage(imagePath);
            input.Deskew();  // Straighten rotated images
            input.DeNoise(); // Remove digital noise
            input.EnhanceResolution(225); // Optimize DPI for OCR
            // Perform OCR
            var result = _ocr.Read(input);
            // Output results
            Console.WriteLine($"Confidence: {result.Confidence}%");
            Console.WriteLine($"Text Found:\n{result.Text}");
            // Process any barcodes found
            foreach (var barcode in result.Barcodes)
            {
                Console.WriteLine($"Barcode: {barcode.Value} ({barcode.Format})");
            }
            // Save as searchable PDF
            result.SaveAsSearchablePdf("output.pdf");
        }
    }
    class Program
    {
        static void Main(string[] args)
        {
            var processor = new OcrProcessor();
            processor.ProcessDocument("images/sample-invoice.jpg");
        }
    }
}
using IronOcr;
using System;
using System.IO;
namespace MyOcrProject
{
    public class OcrProcessor
    {
        private readonly IronTesseract _ocr;
        public OcrProcessor()
        {
            _ocr = new IronTesseract();
            // Configure for optimal accuracy
            _ocr.Configuration.ReadBarCodes = true;
            _ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;
            _ocr.Language = OcrLanguage.English;
        }
        public void ProcessDocument(string imagePath)
        {
            using var input = new OcrInput();
            // Load and preprocess the image
            input.LoadImage(imagePath);
            input.Deskew();  // Straighten rotated images
            input.DeNoise(); // Remove digital noise
            input.EnhanceResolution(225); // Optimize DPI for OCR
            // Perform OCR
            var result = _ocr.Read(input);
            // Output results
            Console.WriteLine($"Confidence: {result.Confidence}%");
            Console.WriteLine($"Text Found:\n{result.Text}");
            // Process any barcodes found
            foreach (var barcode in result.Barcodes)
            {
                Console.WriteLine($"Barcode: {barcode.Value} ({barcode.Format})");
            }
            // Save as searchable PDF
            result.SaveAsSearchablePdf("output.pdf");
        }
    }
    class Program
    {
        static void Main(string[] args)
        {
            var processor = new OcrProcessor();
            processor.ProcessDocument("images/sample-invoice.jpg");
        }
    }
}
$vbLabelText   $csharpLabel

Dieses umfassende Beispiel zeigt mehrere IronOCR-Fähigkeiten. Der Konstruktor konfiguriert die OCR-Engine mit aktiviertem Strichcodelesen und automatischer Segmentierung. Die ProcessDocument Methode demonstriert die Bildvorverarbeitung durch Entzerren (Korrektur der Rotation), Entrauschen (Entfernen von Artefakten) und Verbesserung der Auflösung . Nach der Verarbeitung extrahiert es englischen Text mit Vertrauenswerten, identifiziert Barcodes und erstellt ein durchsuchbares PDF.

Für fortgeschrittene Szenarien können Sie die OcrInput-Klasse für mehr Kontrolle nutzen, asynchrone Verarbeitung für eine bessere Leistung verwenden oder eine Fortschrittsverfolgung für langlaufende Operationen implementieren. Die Klasse OcrResult liefert detaillierte Ausgabedaten, einschließlich Textpositionen und OCR-Ergebnissen .

Entwickler können IronOCR auch problemlos so konfigurieren, dass andere Sprachen wie Chinesisch, Spanisch oder Französisch gelesen werden, was es zu einer vielseitigen Wahl für mehrsprachige GitHub-Projekte macht. Hinweise zur Installation zusätzlicher Sprachpakete finden Sie im Leitfaden für 125 internationale Sprachen . Sie können sogar benutzerdefinierte Sprachdateien verwenden oder benutzerdefinierte Schriftarten trainieren .

! Geteilter Bildschirm mit OCR-Demo: Links wird verzerrter Lorem-Ipsum-Text auf weißem Hintergrund angezeigt, rechts die Visual Studio-Debugkonsole mit der extrahierten Textausgabe und einem Konfidenzwert von 87,34 %.

Was sollte ich in meine .gitignore-Datei aufnehmen?

Für Ihre .gitignore-Datei einschließen:

# IronOCR runtime files
runtimes/
# Test images and outputs
*.pdf
test-images/
output/
# License keys
appsettings.*.json

Erfahren Sie mehr über den IronOCR-Runtimes-Ordner und die korrekte Lizenzschlüsselverwaltung .

Warum sollte ich IronOCR für meine GitHub-Projekte wählen?

IronOCR bietet Entwicklern, die OCR-Projekte auf GitHub pflegen, deutliche Vorteile. Die Bibliothek erreicht 99,8% Genauigkeit von Haus aus, ohne dass manuelles Training oder komplexe Konfigurationsdateien erforderlich sind, die Repositories überladen. Mit Unterstützung für über 125 Sprachen kann Ihr GitHub-Projekt internationale Benutzer ohne Modifikation bedienen. Die Kompatibilitätsfunktionen gewährleisten eine plattformübergreifende Bereitstellung unter Windows, Linux, macOS und Cloud-Plattformen wie Azure und AWS .

Was unterscheidet IronOCR von anderen OCR-Lösungen?

IronOCR ist flexibel genug, um einzelne Wörter, Zeilen und ganze Absätze zu erkennen, und gibt Ihnen die Kontrolle darüber, wie viele Details Sie aus jedem Scan extrahieren. Die Bibliothek zeichnet sich durch ihre Expertise bei speziellen Dokumententypen aus, darunter Kfz-Kennzeichen , Reisepässe , MICR-Schecks , handschriftliche Texte , Screenshots , gescannte Dokumente und sogar Tabellen in Dokumenten .

Die kommerzielle Lizenz bietet rechtliche Klarheit für öffentliche Repositories. Es ist Ihnen ausdrücklich gestattet, IronOCR in kommerziellen Anwendungen einzusetzen. Die integrierten Bildvorverarbeitungsfilter umfassen erweiterte Optionen wie Farbkorrektur , Qualitätsverbesserung und den leistungsstarken Filterassistenten , der automatisch optimale Einstellungen findet.

Warum ist die Single-DLL-Architektur wichtig?

Die Architektur von IronOCR mit einem einzigen DLL bedeutet, dass Mitwirkende Ihr Repository klonen und sofort mit der Entwicklung beginnen können, ohne sich mit nativen Abhängigkeiten oder plattformspezifischen Konfigurationen herumzuschlagen, die andere OCR-Lösungen plagen. Diese Einfachheit ist der Grund, warum Entwickler IronOCR dem reinen Tesseract vorziehen. Die Bibliothek beinhaltet Tesseract 5 mit zahlreichen Leistungsverbesserungen und Multithreading-Unterstützung .

Was sind die Best Practices für die Versionskontrolle bei OCR-Projekten?

Bei der Verwaltung von OCR-Projekten auf GitHub sollte Git LFS für große Testbilder verwendet werden. Für die Verarbeitung von PDF- oder Bilddatenströmen empfiehlt sich die Verwendung von System.Drawing-Objekten , um eine bessere Speicherverwaltung zu gewährleisten.

Wie gehe ich mit großen Dateien in Git um?

git lfs track "*.jpg" "*.png" "*.tiff"
git add .gitattributes
git lfs track "*.jpg" "*.png" "*.tiff"
git add .gitattributes
$vbLabelText   $csharpLabel

Dies ist besonders wichtig bei der Arbeit mit hochauflösenden Bildern oder mehrseitigen TIFF-Dateien . Bei Scans mit geringer Qualität kann die Vorverarbeitung von IronOCR die Ergebnisse deutlich verbessern.

Wie verwalte ich Lizenzschlüssel und Dokumentation?

Speichern Sie IronOCR-Lizenzschlüssel sicher unter Verwendung von Umgebungsvariablen oder Benutzergeheimnissen und nie direkt einchecken. Befolgen Sie die IronOCR-Lizenzschlüssel-Anleitung für die richtige Implementierung. Sie können Lizenzen auch in der web.config-Datei für ASP.NET-Anwendungen konfigurieren. Dokumentieren Sie unterstützte Bildformate und die erwartete Genauigkeit in Ihrer README. Fügen Sie Beispielbilder in einem Testdatenordner hinzu, damit Mitwirkende die OCR-Funktionalität überprüfen können. Für plattformübergreifende Entwicklungen beziehen Sie sich auf den IronOCR Linux-Einrichtungsleitfaden oder die macOS-Installationsanweisungen. Mobile-Entwickler sollten den Android-Leitfaden und den iOS-Leitfaden konsultieren.

Für erweiterte Funktionen, Dokumentnutzung von Computer Vision zur Texterkennung, Seitenrotationserkennung , hOCR-Export und Timeout-Konfiguration für langlaufende Operationen. Erwägen Sie die Implementierung von Abbruchtoken für abbrechbare Operationen.

Was sind gängige Tipps zur Fehlerbehebung?

Warum funktioniert OCR unter Windows nicht?

Häufige Installationsprobleme sind fehlende Visual C++ Redistributables unter Windows. IronOCR benötigt die Version 2019. Detaillierte Anweisungen finden Sie im Leitfaden zur Fehlerbehebung für Visual C++ Redistributable . Bei Linux-Installationen muss sichergestellt werden, dass libgdiplus installiert ist . Sollte die Texterkennung mangelhaft erscheinen, überprüfen Sie anhand der DPI-Einstellungsanleitung, ob Ihre Bilder mindestens 200 DPI aufweisen. Die C# OCR-Community auf Stack Overflow bietet auch hilfreiche Lösungen für häufige GitHub-Projektprobleme.

Bei spezifischen Problemen konsultieren Sie Leitfäden zur allgemeinen Fehlerbehebung , zur Bereitstellung von Azure Functions , zu Problemen mit AWS Lambda oder zu Alternativen zu System.Drawing für .NET 7+. Das Hilfsprogramm IronOCR kann bei der Diagnose von Konfigurationsproblemen helfen.

Wo erhalte ich weitere Unterstützung?

Für detaillierte Fehlerbehebung konsultieren Sie den IronOCR-Fehlerbehebungsleitfaden. Das Support-Team von IronOCR bietet schnelle Unterstützung für lizenzierte Benutzer, die an auf GitHub gehosteten OCR-Anwendungen arbeiten. Im Änderungsprotokoll des Produkts finden Sie die neuesten Aktualisierungen und in der API-Referenz eine umfassende Dokumentation.

Was sind die nächsten Schritte?

IronOCR vereinfacht die OCR-Implementierung in C# GitHub-Projekten durch seine intuitive API, umfassende Vorverarbeitung und zuverlässige Genauigkeit. Starten Sie mit den obigen Codebeispielen, erkunden Sie die offiziellen Repositories und bauen Sie leistungsstarke Dokumentenverarbeitungsanwendungen, die die kollaborativen Funktionen von GitHub nutzen. Egal ob Sie MAUI-Anwendungen entwickeln, spezielle Dokumente verarbeiten oder OCR in einer einzigen Codezeile implementieren möchten, IronOCR bietet Ihnen die Werkzeuge, die Sie benötigen.

Laden Sie IronOCRs kostenlose Testversion für den kommerziellen Einsatz herunter. Entdecken Sie Lizenzoptionen wie Erweiterungen und Upgrades , die auf die Bedürfnisse Ihres Teams zugeschnitten sind.

Häufig gestellte Fragen

Was ist der Hauptzweck des OCR C# GitHub-Tutorials?

Der Hauptzweck des OCR C# GitHub-Tutorials ist es, Entwicklern zu helfen, Texterkennung in ihre GitHub-Projekte mit IronOCR zu implementieren. Es enthält Code-Beispiele und Tipps zur Versionskontrolle.

Wie kann IronOCR meine C#-Projekte auf GitHub verbessern?

IronOCR kann Ihre C#-Projekte auf GitHub verbessern, indem es leistungsstarke Texterkennungsfähigkeiten bietet, die es Ihnen ermöglichen, Text mit hoher Genauigkeit aus Bildern zu extrahieren und zu manipulieren.

Welche Vorteile bietet IronOCR für die Texterkennung?

IronOCR bietet mehrere Vorteile für die Texterkennung, darunter Benutzerfreundlichkeit, hohe Genauigkeit und nahtlose Integration in C#-Projekte, was es zu einer idealen Wahl für Entwickler macht, die mit textbasierten Bilddaten arbeiten.

Gibt es im OCR C# GitHub-Tutorial Code-Beispiele?

Ja, das OCR C# GitHub-Tutorial enthält Code-Beispiele, die demonstrieren, wie man Texterkennung mit IronOCR in Ihren Projekten implementiert.

Welche Art von Versionskontrolltipps werden im Tutorial bereitgestellt?

Das Tutorial bietet Versionskontrolltipps, die dabei helfen, Änderungen in Ihren Projekten effektiv zu managen, wenn IronOCR integriert wird, um reibungslose Zusammenarbeit und Projektwartung zu gewährleisten.

Kann ich IronOCR für Echtzeit-Texterkennungsanwendungen nutzen?

Ja, IronOCR kann für Echtzeit-Texterkennungsanwendungen genutzt werden, dank seiner effizienten Verarbeitungskapazitäten und Unterstützung für verschiedene Bildformate.

Welche Bildformate unterstützt IronOCR für die Texterkennung?

IronOCR unterstützt eine breite Palette von Bildformaten für die Texterkennung, darunter JPEG, PNG, BMP, GIF und TIFF, um die Kompatibilität mit den meisten Bildquellen zu gewährleisten.

Gibt es eine Testversion von IronOCR?

Ja, es gibt eine Testversion von IronOCR, die es Entwicklern ermöglicht, seine Funktionen und Leistungsfähigkeit in ihren Projekten zu testen, bevor sie sich zum Kauf verpflichten.

Wie behandelt IronOCR verschiedene Sprachen in der Texterkennung?

IronOCR unterstützt mehrere Sprachen für die Texterkennung, wodurch Entwickler mit Leichtigkeit Text aus Bildern in verschiedenen Sprachen extrahieren können.

Welche Systemanforderungen gibt es für die Verwendung von IronOCR in C#-Projekten?

IronOCR ist kompatibel mit .NET Framework und .NET Core und kann einfach in C#-Projekte integriert werden, ohne umfangreiche Systemressourcen zu benötigen.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen