Japanische OCR in C# und .NET
Andere Versionen dieses Dokuments:
- 日本語で
-
IronOCR ist eine C#-Softwarekomponente, die es .NET-Programmierern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Japanisch, zu lesen. Es handelt sich dabei um einen fortschrittlichen Fork von Tesseract, der ausschließlich für .NET-Entwickler entwickelt wurde und andere Tesseract-Engines regelmäßig in Bezug auf Geschwindigkeit und Genauigkeit übertrifft.
Es wurde auf vielen verschiedenen Hardware-Plattformen getestet, und die Software-Bibliothek wurde auf die neueste Version von .NET aktualisiert. Es ist eine gute Wahl für Entwickler, die OCR in ihren Anwendungen oder Projekten durchführen müssen. IronOCR bietet Anwendungsentwicklern eine einfach zu verwendende API, die mit vielen Sprachen funktioniert und auf verschiedene Weise in Anwendungen integriert werden kann. IronOCR unterstützt 127 OCR-Sprachen. Es ist ein fantastisches OCR-Tool.
Inhalt von IronOcr.Languages.Japanese
Das japanische IronOCR-Paket führt eine Vielzahl von Operationen durch. Dieses Paket enthält 286 OCR-Sprachen für .NET:
- JapanischesAlphabet
- JapanischAlphabetBest
- JapanischAlphabetFast
- JapanischesVertikalAlphabet
- JapanischVertikalesAlphabetBest
- JapaneseVerticalAlphabetFast
- Japanisch
- JapanischBeste
- JapanischSchnell
- JapanischVertikal
- JapanischVertikalBest
- JapanischVertikalSchnell
Herunterladen
Sie können das IronOCR Japanese Language Pack herunterladen[日本語(にほんご)] unter den folgenden Links:
- Herunterladen als Reißverschluss
-
Installieren mit NuGet
In den folgenden Abschnitten wird die Installation von IronOCR erläutert.
Verwendung von IronOCR für die japanische Sprache
Erstellen oder Öffnen eines C#-Projekts
Beginnen wir mit der Erstellung eines C#-Projekts. Wir verwenden Visual Studio 2022, um ein C#-Projekt zu erstellen - Sie können eine beliebige Version nach Ihren Vorlieben wählen. Es wird empfohlen, die neueste Version von Visual Studio zu verwenden. Führen Sie die folgenden Schritte aus, um ein C#-Projekt zu erstellen:
- Öffnen Sie Visual Studio 2022.
-
Klicken Sie auf die Schaltfläche "Ein neues Projekt erstellen".
-
Geben Sie "Windows" in die Suchleiste ein, wählen Sie die Anwendung "Windows Form " aus den Suchergebnissen aus und klicken Sie auf die Schaltfläche "Weiter".
-
Geben Sie dem Projekt einen Namen. Ich habe das Projekt "JapaneseOCR" genannt Nach der Benennung klicken Sie auf die Schaltfläche "Weiter".
-
Wählen Sie auf dem nächsten Bildschirm das .NET-Framework aus. Wählen Sie das .NET-Framework entsprechend den Anforderungen Ihres Projekts. Wir wählen für dieses Tutorial die Version .NET 5.0.
-
Klicken Sie nach der Auswahl auf die Schaltfläche "Erstellen". Es wird einfach das C# Windows Form Projekt in Visual Studio erstellen.
Das Projekt wurde erstellt! Wir können sie nun in unserer IronOCR-Bibliothek verwenden. Wir können es auch mit einem bestehenden C#-Projekt verwenden. Öffnen Sie das Projekt und beginnen Sie mit der Installation der IronOCR-Bibliothek. Im folgenden Abschnitt wird erläutert, wie die IronOCR-Bibliothek in C#-Projekten installiert wird.
Einrichtung
Nun ist es an der Zeit, die IronOCR-Bibliothek in unserem Projekt zu installieren. Die IronOCR-Bibliothek kann auf zwei verschiedene Arten installiert werden. IronOCR kann über die Package Manager Console und den NuGet Package Manager installiert werden. Schauen wir uns beide Methoden an.
NuGet-Paketmanager verwenden
Um die IronOCR-Bibliothek mit dem NuGet Package Manager zu installieren, müssen wir die NuGet Package Manager-Schnittstelle öffnen. Folgen Sie den folgenden Schritten, um die IronOCR-Bibliothek zu installieren:
-
Klicken Sie im Hauptmenü auf "Tools", wählen Sie aus dem Dropdown-Menü den Punkt "NuGet Package Manager" und wählen Sie "Manage NuGet Package Manager for Solution"
-
Dadurch wird die Oberfläche des NuGet-Paketmanagers geöffnet. Gehen Sie auf die Registerkarte Durchsuchen und geben Sie IronOCR Japanisch in die Suchleiste ein. Wählen Sie das japanische Paket aus den Suchergebnissen aus und klicken Sie auf die Schaltfläche "Installieren", um die Installation zu starten.
- Die Installation der Bibliothek wird gestartet. Nach der Installation können Sie die IronOCR-Bibliothek in Ihrem Projekt verwenden.
Verwendung der Paketmanager-Konsole
Wir installieren die IronOCR-Bibliothek über die Paketverwaltungskonsole. Die Installation der Bibliothek kann problemlos über die Konsole erfolgen. Schauen wir uns an, wie wir die IronOCR-Bibliothek über die Konsole installieren können:
- Öffnen Sie das Projekt und rufen Sie die Paketmanager-Konsole in Visual Studio auf. Es befindet sich normalerweise am unteren Rand von Visual Studio.
- Geben Sie folgenden Befehl in die Konsole ein, um die IronOCR OCR-Sprache Japanisch zu installieren:
PM> Install-Package IronOCR.Languages.Japanese
-
Die Installation beginnt, und Sie sehen den Fortschritt in der Konsole. Nach der Installation sehen Sie die IronOCR-Abhängigkeit im Abschnitt "Abhängigkeiten" im Solution Explorer.
Nach der Installation können Sie die Bibliothek ohne Fremdsoftware nutzen. Als nächstes ist es an der Zeit, das Front-End unseres Programms einzurichten.
Code-Beispiel: Japanische Sprache für OCR
Es ist nun an der Zeit, den Code für die Implementierung der IronOCR-Bibliothek für die japanische Sprache zu schreiben. Zunächst müssen wir das Frontend für die Auswahl der Bilddatei entwickeln. Schauen wir uns an, wie man das macht.
Entwicklung des Frontends
Für die Front-End-Entwicklung werden wir die Vorteile der "Toolbox" in Visual Studio nutzen. Es hat viele vorgefertigte Elemente, die wir zur Gestaltung unseres Frontends verwenden können. Wir werden ein Bildfeld, ein Rich-Text-Feld, eine Schaltfläche und zwei Beschriftungen zur Identifizierung verwenden. Wir werden diesen Elementen eine angemessene Form und ein gutes UI nach unseren Bedürfnissen geben. Sie können die Größe und die Eigenschaften der Bestandteile nach Ihren Wünschen ändern. Wir machen das Ausgabe-Textfeld uneditierbar, und die Bildeigenschaft des Bildfeldes ist "Zoom", so dass jedes Bild in das Bildfeld passt. Unser Frontend wird wie folgt aussehen:

Backend-Code für IronOCR:
Unser Frontend ist fertig. Jetzt ist es an der Zeit, es in Betrieb zu nehmen. Aber zuerst müssen wir den IronOCR-Namensraum importieren, um IronOCR in unserem Code zu verwenden. Schreiben Sie die folgende Zeile an den Anfang der Datei:
using IronOCR;
using IronOCR;
Imports IronOCR
Die Schaltfläche "Bild auswählen" dient zur Auswahl japanischer Bilder. Und wenn wir das Bild auswählen, wird es automatisch in den Bildrahmen geladen und sichtbar. Gleichzeitig beginnt IronOCR mit der Erkennung japanischer Wörter aus hochgeladenen Bildern. Nach Abschluss des Vorgangs wird die Ausgabe in der Rich-Text-Box angezeigt. Fügen wir der Schaltfläche diese Funktionen hinzu, indem wir auf sie doppelklicken. Hier ein Beispiel für den Code für die Schaltflächenfunktionalität. Außerdem wird der ausgegebene Text in einer "txt"-Datei gespeichert.
Code-Beispiel
private void btn_image_Click(object sender, EventArgs e)
{
OpenFileDialog open = new OpenFileDialog();
if (open.ShowDialog() == DialogResult.OK)
{
// display image in picture box
img_image.Image = new Bitmap(open.FileName);
// image file path
//textBox1.Text = open.FileName;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.JapaneseBest;
using (var Input = new OcrInput(open.FileName))
{
var Result = Ocr.Read(Input);
txt_output.Text = Result.Text;
Result.SaveAsTextFile("JapaneseText.txt");
}
}
}
private void btn_image_Click(object sender, EventArgs e)
{
OpenFileDialog open = new OpenFileDialog();
if (open.ShowDialog() == DialogResult.OK)
{
// display image in picture box
img_image.Image = new Bitmap(open.FileName);
// image file path
//textBox1.Text = open.FileName;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.JapaneseBest;
using (var Input = new OcrInput(open.FileName))
{
var Result = Ocr.Read(Input);
txt_output.Text = Result.Text;
Result.SaveAsTextFile("JapaneseText.txt");
}
}
}
Private Sub btn_image_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim open As New OpenFileDialog()
If open.ShowDialog() = DialogResult.OK Then
' display image in picture box
img_image.Image = New Bitmap(open.FileName)
' image file path
'textBox1.Text = open.FileName;
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.JapaneseBest
Using Input = New OcrInput(open.FileName)
Dim Result = Ocr.Read(Input)
txt_output.Text = Result.Text
Result.SaveAsTextFile("JapaneseText.txt")
End Using
End If
End Sub
In dieser Funktion implementieren wir, dass, wenn der Benutzer auf die Schaltfläche klickt, ein Auswahldialogfeld erscheint und den Benutzer auffordert, ein Bild auszuwählen, das japanischen Text enthält. Wenn der Benutzer das Bild auswählt, wird die Bitmap() Die Funktion nimmt den Bildpfad und lädt ihn in den Bildrahmen. Nach dem Laden initialisieren wir die IronOCR-Bibliothek und setzen die Sprache auf "Japanisch ". IronOCR übernimmt den Bildpfad als Eingabe und beginnt mit dem Scannen. Nach dem Scannen wird der Ausgabetext in der Variablen "Ergebnis" gespeichert und als Ausgabe im Rich-Text-Feld angezeigt. Schließlich werden die Ausgabedateien als "txt"-Dateien mit dem Namen "JapaneseText " gespeichert
Das Projekt ausführen
Wir haben den Code entworfen und das Backend implementiert. Nun ist es an der Zeit, das Programm auszuführen, um zu prüfen, ob die Funktionalität gut funktioniert.
-
Klicken Sie auf die grüne Play-Taste, um das Projekt zu starten. Dieser Bildschirm wird in der Mitte des Bildschirms unseres Betriebssystems angezeigt.
-
Klicken Sie auf die Schaltfläche "Bild auswählen" und wählen Sie das Bild mit dem japanischen Text aus.
-
Sie sehen den ausgegebenen Bildtext in der Rich-Text-Box.
- Eine Textdatei mit dem OCR-Ergebnis wird unter dem Namen "JapaneseText" gespeichert
Die OCR-Genauigkeit von IronOCR ist ausgezeichnet.
Zusammenfassung
In diesem Tutorium haben wir gelernt, wie man die IronOCR-Bibliothek für japanischen Text verwendet. Wenn Sie mehr über IronOCR erfahren möchten, klicken Sie bitte auf diesen Link link.
Für weitere Informationen über Iron Software klicken Sie bitte auf diesen Link link. Wenn Sie die IronOCR-Bibliothek ausprobieren möchten, können Sie die kostenlose Testversion aktivieren, ohne etwas zu bezahlen. Iron Software bietet derzeit ein Sonderangebot an, bei dem Sie eine Suite von fünf Softwareprodukten zum Preis von nur zwei erwerben können. Für weitere Informationen, klicken Sie bitte hier.