Zum Fußzeileninhalt springen
VERWENDUNG VON IRONOCR

OCR C# GitHub: Texterkennung mit IronOCR

IronOCR vereinfacht die OCR-Integration in C# GitHub -Projekte durch die Bereitstellung einer einzigen DLL-Lösung mit 99,8% Genauigkeit, integrierter Vorverarbeitung und Unterstützung für mehr als 125 Sprachen, wodurch die komplexe Konfiguration, die bei herkömmlichen Tesseract-Implementierungen erforderlich ist, entfällt.

Starten Sie jetzt mit IronOCR.
green arrow pointer

Wenn Sie ein C#-Entwickler sind, der auf GitHub nach OCR-Optionen sucht, benötigen Sie wahrscheinlich mehr als nur Code. Sie wünschen sich eine Bibliothek, die sofort einsatzbereit ist, mit lauffähigen Beispielen ausgeliefert wird und von einer aktiven Community unterstützt wird. Zuverlässige Integration und solide Versionskontrolle sind genauso wichtig wie Genauigkeit. Diese Anleitung zeigt Ihnen, wie Sie IronOCR in Ihre GitHub -Projekte einbinden, um die Texterkennung in Bildern und PDFs sicher durchführen zu können.

Egal ob Sie Klartext extrahieren, strukturierte Wörter und Zeilen herausfiltern oder durchsuchbare PDFs zur Archivierung erstellen möchten – IronOCR bietet Ihnen die passende Lösung. Die Bibliothek unterstützt alles von der Barcode-Erkennung bis zur mehrsprachigen OCR in über 125 Sprachen.

Wie fange ich mit IronOCR und GitHub an?

IronOCR ist eine .NET OCR-Lösung, die sich nahtlos in GitHub-basierte Entwicklungs-Workflows einfügt. Im Gegensatz zu rohen Tesseract-Implementierungen, die eine komplexe Konfiguration erfordern, bietet IronOCR eine verfeinerte API, die Sie in wenigen Minuten zum Laufen bringt.

Für alle, die sich noch nicht mit optischer Zeichenerkennung auskennen, deckt die Dokumentation von IronOCR alles ab, von der grundlegenden Textextraktion bis hin zur fortgeschrittenen Bildverarbeitung. Die Bibliothek beinhaltet integrierte Unterstützung für Bildfilter und OCR-Optimierungstechniken, die andernfalls eine umfangreiche manuelle Anpassung erfordern würden.

Ein Grund, warum Entwickler bei GitHub -Projekten gerne auf IronOCR zurückgreifen, ist die Vorhersagbarkeit. Wenn ein Mitwirkender Ihr Repository klont und Ihr Projekt ausführt, sollte sich die OCR-Engine auf seinem Rechner identisch verhalten. Die in sich geschlossene Architektur von IronOCR ermöglicht dies, ohne dass plattformspezifische native Binärdateien in Ihrem Repository festgelegt werden müssen.

Welche Installationsmethode sollten Sie verwenden?

Beginnen Sie mit der Installation von IronOCR über den NuGet-Paket-Manager:

Install-Package IronOcr

 Das Fenster des NuGet Paket-Managers in Visual Studio zeigt die Suchergebnisse für das IronOCR -Paket mit verschiedenen verfügbaren Sprachpaketen zur Installation.

NuGet Mit NuGet installieren

PM >  Install-Package IronOcr

Schauen Sie sich IronOCR auf NuGet für eine schnelle Installation an. Mit über 10 Millionen Downloads transformiert es die PDF-Entwicklung mit C#. Sie können auch das DLL oder den Windows Installer herunterladen.

Für fortgeschrittene Installationsszenarien konsultieren Sie bitte den NuGet Paketleitfaden . Wenn Sie auf bestimmten Plattformen bereitstellen, sehen Sie sich die Anleitungen für Windows , Linux , macOS oder Docker-Container an.

Wo findet man Beispielcode?

IronOCR unterhält offizielle GitHub Repositories mit Beispielen und Tutorials. Das IronOCR Examples-Repository bietet praxisnahe Implementierungen, während das Image to Text-Tutorial-Repository praktische Anwendungsfälle demonstriert, die Sie klonen und modifizieren können.

Diese Repositories demonstrieren OCR mit Barcode-Lesung, Mehrsprachigkeitsunterstützung und PDF-Verarbeitung. Da IronOCR regelmäßig neue Pakete auf NuGet veröffentlicht, haben Sie immer Zugriff auf die neuesten stabilen Versionen.

Flussdiagramm der OCR-Verarbeitungspipeline: GitHub OCR-Repository → IronOCR Projekt → OCR-Verarbeitung → Extrahierter Text

Wie erstellt man sein erstes OCR-Projekt auf GitHub?

Die Entwicklung einer OCR-Anwendung, die für die gemeinsame Nutzung auf GitHub geeignet ist, erfordert eine einheitliche Struktur, in der sich die Mitwirkenden sofort zurechtfinden. Erstellen Sie in Visual Studio (oder Ihrer bevorzugten IDE) eine neue Konsolenanwendung, die den etablierten Konventionen für die OCR-Entwicklung entspricht.

Welche Projektstruktur sollten Sie verwenden?

MyOcrProject/
├── src/
│   └── OcrProcessor.cs
├── images/
│   └── sample-invoice.jpg
├── .gitignore
├── README.md
└── MyOcrProject.csproj

Diese Struktur unterstützt verschiedene Eingabeformate, darunter JPG, PNG, TIFF und BMP. Mehrseitige TIFF- oder GIF-Dateien werden von IronOCR automatisch verarbeitet.

Der Ordner images/ sorgt für übersichtliche Beispieldateien und erleichtert es den Mitwirkenden, Testbilder hinzuzufügen, ohne das Stammverzeichnis zu überladen. Die Trennung des Ordners src/ von den Konfigurationsdateien erleichtert das Erfassen des Projekts auf einen Blick. Fügen Sie ein README.md hinzu, das erklärt, was das Projekt bewirkt, welche Lizenzschlüsselvariable eingestellt werden muss und wie das Beispiel ausgeführt wird.

Wie implementiert man den OCR-Verarbeitungscode?

Das folgende Beispiel zeigt einen vollständigen OCR-Prozessor, der die wichtigsten Funktionen von IronOCR demonstriert, darunter Bildvorverarbeitung, Textextraktion und Barcode-Erkennung:

using IronOcr;

var ocr = new IronTesseract();
ocr.Configuration.ReadBarCodes = true;
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;
ocr.Language = OcrLanguage.English;

using var input = new OcrInput();
input.LoadImage("images/sample-invoice.jpg");
input.Deskew();
input.DeNoise();
input.EnhanceResolution(225);

var result = ocr.Read(input);

Console.WriteLine($"Confidence: {result.Confidence}%");
Console.WriteLine($"Text Found:\n{result.Text}");

foreach (var barcode in result.Barcodes)
{
    Console.WriteLine($"Barcode: {barcode.Value} ({barcode.Format})");
}

result.SaveAsSearchablePdf("output.pdf");
using IronOcr;

var ocr = new IronTesseract();
ocr.Configuration.ReadBarCodes = true;
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;
ocr.Language = OcrLanguage.English;

using var input = new OcrInput();
input.LoadImage("images/sample-invoice.jpg");
input.Deskew();
input.DeNoise();
input.EnhanceResolution(225);

var result = ocr.Read(input);

Console.WriteLine($"Confidence: {result.Confidence}%");
Console.WriteLine($"Text Found:\n{result.Text}");

foreach (var barcode in result.Barcodes)
{
    Console.WriteLine($"Barcode: {barcode.Value} ({barcode.Format})");
}

result.SaveAsSearchablePdf("output.pdf");
$vbLabelText   $csharpLabel

Dieses Beispiel demonstriert verschiedene Funktionen von IronOCR . Der Konstruktor konfiguriert die OCR-Engine mit aktivierter Barcode-Lesung und automatischer Seitensegmentierung. Die Vorverarbeitungspipeline umfasst Entzerrung (Korrektur der Rotation), Rauschunterdrückung (Entfernung von Artefakten) und Auflösungsverbesserung.

Nach der Verarbeitung extrahiert die Engine englischen Text mit Konfidenzwerten, identifiziert Barcodes und generiert ein durchsuchbares PDF. Der Code ist unter Verwendung von Top-Level-Anweisungen for .NET 10 geschrieben, wodurch das Beispiel kurz und lesbar bleibt.

Für fortgeschrittene Szenarien können Sie die asynchrone Verarbeitung für einen besseren Durchsatz nutzen oder die Fortschrittsverfolgung für langlaufende Operationen implementieren. Die Klasse OcrResult liefert eine detaillierte Ausgabe einschließlich Textpositionen, Wortkoordinaten und Absatzstruktur – und bietet Ihnen damit weit mehr als nur eine einfache Textzeichenfolge.

Entwickler können IronOCR auch so konfigurieren, dass es andere Sprachen wie Chinesisch, Spanisch oder Französisch lesen kann, was es zu einer guten Wahl für mehrsprachige GitHub -Projekte macht. Hinweise zur Installation zusätzlicher Sprachpakete finden Sie im Leitfaden für 125 internationale Sprachen .

Geteilter Bildschirm mit OCR-Demo: Links wird verzerrter Lorem-Ipsum-Text auf weißem Hintergrund angezeigt, rechts die Visual Studio-Debugkonsole mit extrahiertem Text und einem Konfidenzwert von 87,34 %.

Was sollte in Ihre .gitignore-Datei aufgenommen werden?

Fügen Sie Ihrer .gitignore-Datei Einträge hinzu, die verhindern, dass Laufzeitartefakte, Testausgaben und geheime Konfigurationen übernommen werden:

# IronOCR runtime files
runtimes/
# Test images and outputs
*.pdf
test-images/
output/
# License keys
appsettings.*.json

Es ist besonders wichtig, den Ordner runtimes/ nicht in die Quellcodeverwaltung aufzunehmen, da IronOCR plattformspezifische Binärdateien zur Build-Zeit herunterlädt. Das Einchecken dieser Dateien würde Ihr Repository unnötig aufblähen und Plattformkonflikte verursachen. Erfahren Sie mehr über die Verwaltung von Lizenzschlüsseln für eine ordnungsgemäße Implementierung.

Warum sollten Sie IronOCR für Ihre GitHub Projekte wählen?

IronOCR bietet Entwicklern, die OCR-Projekte auf GitHub pflegen, deutliche Vorteile. Die Bibliothek erreicht 99,8% Genauigkeit von Haus aus, ohne dass manuelles Training oder komplexe Konfigurationsdateien erforderlich sind, die Repositories überladen. Dank der Unterstützung von über 125 Sprachen kann Ihr GitHub Projekt ohne Anpassungen von internationalen Nutzern verwendet werden.

Die Kompatibilitätsfunktionen gewährleisten eine plattformübergreifende Bereitstellung unter Windows, Linux, macOS und Cloud-Plattformen wie Azure und AWS . Diese plattformübergreifende Funktionalität ist von entscheidender Bedeutung für Open-Source- und Teamprojekte, bei denen die Mitwirkenden möglicherweise auf unterschiedlichen Betriebssystemen arbeiten.

Was unterscheidet IronOCR von anderen OCR-Lösungen?

IronOCR ist flexibel genug, um einzelne Wörter, Zeilen und ganze Absätze zu erkennen, sodass Sie genau steuern können, wie viele Details Sie aus jedem Scan extrahieren. Die Bibliothek zeichnet sich durch ihre Expertise bei speziellen Dokumententypen aus, darunter Nummernschilder, Reisepässe, handschriftliche Texte, Screenshots und gescannte Dokumente.

Die kommerzielle Lizenz bietet rechtliche Klarheit für öffentliche Repositories. Sie dürfen IronOCR ausdrücklich in kommerziellen Anwendungen einsetzen. Die integrierten Bildvorverarbeitungsfilter umfassen erweiterte Optionen wie Farbkorrektur, Qualitätsverbesserung und einen Filterassistenten, der automatisch optimale Einstellungen für schwierige Bilder findet.

Warum ist die Single-DLL-Architektur wichtig?

Die Architektur von IronOCR mit einem einzigen DLL bedeutet, dass Mitwirkende Ihr Repository klonen und sofort mit der Entwicklung beginnen können, ohne sich mit nativen Abhängigkeiten oder plattformspezifischen Konfigurationen herumzuschlagen, die andere OCR-Lösungen plagen. Diese Einfachheit ist der Grund, warum Entwickler IronOCR dem reinen Tesseract vorziehen.

Vergleicht man den Aufwand für die Einrichtung, so erfordert eine einfache Tesseract-Implementierung typischerweise die separate Installation nativer Binärdateien, die Konfiguration von PATH-Variablen und die manuelle Verwaltung von tessdata-Sprachdateien. IronOCR kümmert sich um all das intern, sodass sich die README-Datei Ihres Projekts auf die Anwendungslogik konzentrieren kann und nicht auf Anweisungen zur Einrichtung der Umgebung.

Die Bibliothek beinhaltet Tesseract 5 mit zahlreichen Leistungsverbesserungen und Multithreading-Unterstützung, die es Ihnen ermöglichen, mehrere Dokumente parallel zu verarbeiten, ohne benutzerdefinierten Threading-Code schreiben zu müssen.

Was sind die Best Practices für die Versionskontrolle bei OCR-Projekten?

Die Verwaltung von OCR-Projekten auf GitHub bringt einige Herausforderungen mit sich, denen typische Softwareprojekte nicht begegnen. Test-Images sind oft große Binärdateien, Lizenzschlüssel dürfen niemals in Commits erscheinen, und die Vorverarbeitungskonfigurationen können sich zwischen den Umgebungen erheblich unterscheiden.

Eine frühzeitige Auseinandersetzung mit diesen Problemen bedeutet weniger Überraschungen bei der Zusammenarbeit im Team oder beim Annehmen von Pull-Anfragen von Mitwirkenden. Die folgenden Vorgehensweisen sorgen dafür, dass Ihr OCR-Projekt im Laufe der Zeit sauber und wartungsfreundlich bleibt.

Wie geht man mit großen Dateien in Git um?

Verwenden Sie Git LFS für große Test-Images, um die Größe Ihres Repositorys überschaubar zu halten:

git lfs track "*.jpg" "*.png" "*.tiff"
git add .gitattributes
git commit -m "Track large image files with Git LFS"
git lfs track "*.jpg" "*.png" "*.tiff"
git add .gitattributes
git commit -m "Track large image files with Git LFS"
SHELL

Dies ist besonders wichtig bei der Arbeit mit hochauflösenden Bildern oder mehrseitigen TIFF-Dateien. Bei Scans mit geringer Qualität kann die Vorverarbeitung von IronOCR die Ergebnisse deutlich verbessern, ohne dass Sie Testbilder vor der endgültigen Speicherung manuell bearbeiten müssen.

Beim Speichern von Testdokumenten in Ihrem Repository sollten Sie berücksichtigen, ob diese sensible Informationen enthalten. Es ist besser, synthetische Testbilder programmatisch zu generieren, als echte Rechnungen oder Ausweisdokumente zu speichern, selbst in privaten Archiven.

Wie sollten Lizenzschlüssel und Dokumentation verwaltet werden?

Speichern Sie IronOCR Lizenzschlüssel mithilfe von Umgebungsvariablen oder .NET Benutzergeheimnissen. Commits sollten niemals direkt in irgendeinen Branch, auch nicht in einen privaten, eingecheckt werden. Beachten Sie die Hinweise zum Lizenzschlüssel für eine ordnungsgemäße Implementierung. Sie können Lizenzen auch in der web.config-Datei für ASP.NET -Anwendungen konfigurieren.

Beschreiben Sie die unterstützten Bildformate und die zu erwartenden Genauigkeitsgrade in Ihrer README-Datei. Fügen Sie Beispielbilder in einem Ordner test-data/ hinzu, damit die Mitwirkenden die OCR-Funktionalität unmittelbar nach dem Klonen überprüfen können. Fügen Sie einen kurzen Abschnitt hinzu, der erklärt, wie der Lizenzschlüssel über eine Umgebungsvariable festgelegt werden kann, damit neue Mitwirkende bei ihrem ersten Start nicht blockiert werden.

Informationen zur plattformübergreifenden Entwicklung finden Sie im IronOCR -Setup-Leitfaden für Linux oder in den Installationsanweisungen für macOS. Mobile-Entwickler sollten die in der IronOCR Dokumentation verfügbaren Anleitungen für Android und iOS konsultieren.

Was sind gängige Tipps zur Fehlerbehebung?

Warum funktioniert OCR unter Windows nicht?

Häufige Installationsprobleme sind fehlende Visual C++ Redistributables unter Windows. IronOCR benötigt die Version 2019. Detaillierte Anweisungen finden Sie im Leitfaden zur Fehlerbehebung für Visual C++ Redistributable . Für Linux-Bereitstellungen sorgen Sie dafür, dass libgdiplus installiert ist.

Sollte die Texterkennung mangelhaft erscheinen, überprüfen Sie anhand der DPI-Einstellungsanleitung, ob Ihre Bilder mindestens 200 DPI aufweisen. Die C# OCR-Community auf Stack Overflow bietet auch hilfreiche Lösungen für häufige GitHub-Projektprobleme.

Bei spezifischen Konfigurationsproblemen verwenden Sie das IronOCR Hilfsprogramm zur Fehlerdiagnose und die allgemeine Anleitung zur schrittweisen Fehlerbehebung .

Wo erhalten Sie weitere Unterstützung?

Detaillierte Hinweise zur Fehlerbehebung finden Sie im IronOCR Leitfaden zur Fehlerbehebung . Das IronOCR Supportteam bietet lizenzierten Benutzern, die an auf GitHub gehosteten OCR-Anwendungen arbeiten, schnelle Unterstützung. Im Produktänderungsprotokoll finden Sie die neuesten Aktualisierungen.

Was sind Ihre nächsten Schritte?

IronOCR vereinfacht die OCR-Implementierung in C# GitHub -Projekten durch seine intuitive API, die integrierte Vorverarbeitung und die zuverlässige Genauigkeit. Nehmen Sie die oben stehenden Codebeispiele als Ausgangspunkt, erkunden Sie die offiziellen Repositories und entwickeln Sie Dokumentenverarbeitungsanwendungen, die die Kollaborationsfunktionen von GitHub voll ausnutzen.

Egal ob Sie MAUI-Anwendungen entwickeln, spezialisierte Dokumente verarbeiten oder OCR in einer einzigen Codezeile implementieren möchten, IronOCR bietet Ihnen die Werkzeuge, die Sie benötigen. Dank der plattformübergreifenden Unterstützung der Bibliothek und der unkomplizierten NuGet Installation bleibt Ihr Projekt für jeden Mitwirkenden einfach einzurichten, unabhängig von dessen Entwicklungsumgebung.

Laden Sie die kostenlose Testversion von IronOCR herunter und testen Sie es noch heute in Ihrem GitHub Projekt. Entdecken Sie Lizenzoptionen wie Erweiterungen und Upgrades, die auf die Bedürfnisse Ihres Teams zugeschnitten sind.

Häufig gestellte Fragen

Was ist der Hauptzweck des OCR C# GitHub-Tutorials?

Der Hauptzweck des OCR C# GitHub-Tutorials ist es, Entwicklern zu helfen, Texterkennung in ihre GitHub-Projekte mit IronOCR zu implementieren. Es enthält Code-Beispiele und Tipps zur Versionskontrolle.

Wie kann IronOCR meine C#-Projekte auf GitHub verbessern?

IronOCR kann Ihre C#-Projekte auf GitHub verbessern, indem es leistungsstarke Texterkennungsfähigkeiten bietet, die es Ihnen ermöglichen, Text mit hoher Genauigkeit aus Bildern zu extrahieren und zu manipulieren.

Welche Vorteile bietet IronOCR für die Texterkennung?

IronOCR bietet mehrere Vorteile für die Texterkennung, darunter Benutzerfreundlichkeit, hohe Genauigkeit und nahtlose Integration in C#-Projekte, was es zu einer idealen Wahl für Entwickler macht, die mit textbasierten Bilddaten arbeiten.

Gibt es im OCR C# GitHub-Tutorial Code-Beispiele?

Ja, das OCR C# GitHub-Tutorial enthält Code-Beispiele, die demonstrieren, wie man Texterkennung mit IronOCR in Ihren Projekten implementiert.

Welche Art von Versionskontrolltipps werden im Tutorial bereitgestellt?

Das Tutorial bietet Versionskontrolltipps, die dabei helfen, Änderungen in Ihren Projekten effektiv zu managen, wenn IronOCR integriert wird, um reibungslose Zusammenarbeit und Projektwartung zu gewährleisten.

Kann ich IronOCR für Echtzeit-Texterkennungsanwendungen nutzen?

Ja, IronOCR kann für Echtzeit-Texterkennungsanwendungen genutzt werden, dank seiner effizienten Verarbeitungskapazitäten und Unterstützung für verschiedene Bildformate.

Welche Bildformate unterstützt IronOCR für die Texterkennung?

IronOCR unterstützt eine breite Palette von Bildformaten für die Texterkennung, darunter JPEG, PNG, BMP, GIF und TIFF, um die Kompatibilität mit den meisten Bildquellen zu gewährleisten.

Gibt es eine Testversion von IronOCR?

Ja, es gibt eine Testversion von IronOCR, die es Entwicklern ermöglicht, seine Funktionen und Leistungsfähigkeit in ihren Projekten zu testen, bevor sie sich zum Kauf verpflichten.

Wie behandelt IronOCR verschiedene Sprachen in der Texterkennung?

IronOCR unterstützt mehrere Sprachen für die Texterkennung, wodurch Entwickler mit Leichtigkeit Text aus Bildern in verschiedenen Sprachen extrahieren können.

Welche Systemanforderungen gibt es für die Verwendung von IronOCR in C#-Projekten?

IronOCR ist kompatibel mit .NET Framework und .NET Core und kann einfach in C#-Projekte integriert werden, ohne umfangreiche Systemressourcen zu benötigen.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen

Iron Support Team

Wir sind 24 Stunden am Tag, 5 Tage die Woche online.
Chat
E-Mail
Rufen Sie mich an