Japanese OCR in C# and .NET
**Inne wersje tego dokumentu: 日本語で
IronOCR to komponent oprogramowania C#, który umożliwia programistom .NET odczytywanie tekstu z obrazów i dokumentów PDF w 126 językach, w tym w języku japońskim. Jest to zaawansowana gałąź Tesseract, zbudowana wyłącznie dla programistów .NET i regularnie przewyższa inne silniki Tesseract zarówno pod względem prędkości, jak i dokładności.
Został przetestowany na wielu różnych platformach sprzętowych, a biblioteka oprogramowania została zaktualizowana do najnowszej wersji .NET. To dobry wybór dla programistów, którzy muszą wykonywać OCR w swoich aplikacjach lub projektach. IronOCR zapewnia programistom aplikacji łatwe w użyciu API, które działa z wieloma językami i może być zintegrowane z aplikacjami na różne sposoby. IronOCR obsługuje 125 języków OCR. To fantastyczne narzędzie OCR.
Zawartość IronOcr.Languages.Japanese
Pakiet IronOCR Japanese wykonuje szeroki zakres operacji. Ten pakiet zawiera kilka języków OCR dla .NET:
- JapaneseAlphabet
- JapaneseAlphabetBest
- JapaneseAlphabetFast
- JapaneseVerticalAlphabet
- JapaneseVerticalAlphabetBest
- JapaneseVerticalAlphabetFast
- Japanese
- JapaneseBest
- JapaneseFast
- JapaneseVertical
- JapaneseVerticalBest
- JapaneseVerticalFast
Pobieranie
Możesz pobrać pakiet językowy IronOCR Japanese [日本語 (にほんご)] z następujących linków:
- Download as [ Zip ](<a class=)">Zip
- Install with [ NuGet ](<a target=)">NuGet
W kolejnych sekcjach przyjrzymy się instalacji IronOCR.
Używanie IronOCR dla języka japońskiego
Stworz lub otworz projekt C
Zacznijmy od utworzenia projektu C#. Używamy Visual Studio 2022 do stworzenia projektu C# — możesz wybrać dowolną wersję według swoich preferencji. Zalecana jest najnowsza wersja programu Visual Studio. Wykonaj poniższe kroki, aby utworzyć projekt C#:
- Otworz Visual Studio 2022.
- Kliknij przycisk "Utwórz nowy projekt".
- Napisz 'Windows' w pasku wyszukiwania, wybierz "Windows Form" z wynikow wyszukiwania i kliknij przycisk "Next".
- Nadaj nazwe projektowi. Nazwalem projekt "JapaneseOCR." Po nadaniu nazwy kliknij przycisk "Dalej."
- Wybierz .NET framework na nastepnym ekranie. Wybierz .NET framework wedlug potrzeb Twojego projektu. Na potrzeby tego samouczka wybieramy wersje .NET 5.0.
- Po wyborze kliknij przycisk "Create". Latwo stworzy projekt C# Windows Form w Visual Studio.
Projekt został utworzony! Teraz możemy go używać w naszej bibliotece IronOCR. Możemy także używać go z istniejącym projektem C#. Otwórz projekt i rozpocznij instalację biblioteki IronOCR. W poniższej sekcji omówiono, jak zainstalować bibliotekę IronOCR w projektach C#.
Instalacja
Nadszedł czas, aby zainstalować bibliotekę IronOCR w naszym projekcie. Bibliotekę IronOCR można zainstalować na dwa różne sposoby. Możemy zainstalować IronOCR za pomocą konsoli Menedżera pakietów oraz Menedżera pakietów NuGet. Przyjrzyjmy się obu metodom.
Użycie Menadżera Pakietów NuGet
Aby zainstalowac biblioteke IronOCR za pomoca Menedzera Pakietow NuGet, musimy otworzyc interfejs Menedzera Pakietow NuGet. Wykonaj nastepujace kroki, aby zainstalowac biblioteke IronOCR:
- Kliknij "Narzędzia" z głównego menu, z menu rozwijanego, najedź na "Menedżer pakietów NuGet" i wybierz "Zarządzaj pakietami NuGet dla rozwiązania."
- To otworzy interfejs Menedzera Pakietow NuGet. Przejdź do zakładki Przeglądaj i wpisz "IronOCR Japanese" w pasku wyszukiwania. Wybierz pakiet Japanese z wyników wyszukiwania i kliknij przycisk "Zainstaluj", aby rozpocząć instalację.
- Rozpocznie się instalacja biblioteki. Po zainstalowaniu bedziesz mogl korzystac z biblioteki IronOCR w swoim projekcie.
Uzycie Konsoli Menedzera Pakietow
Zainstalujemy bibliotekę IronOCR za pomocą konsoli Menedżera pakietów. Zainstalowanie biblioteki za pomocą konsoli jest bardzo proste. Przyjrzyjmy się, jak możemy zainstalować bibliotekę IronOCR za pomocą konsoli:
- Otwórz projekt i przejdź do konsoli Menedżera pakietów w Visual Studio. Zwykle znajduje się na dole Visual Studio.
-
Wpisz następujące polecenie w konsoli, aby zainstalować język OCR IronOCR Japanese:
PM> Install-Package IronOcr.Languages.JapanesePM> Install-Package IronOcr.Languages.JapaneseSHELL - Rozpocznie się instalacja i będziesz widzieć postęp w konsoli. Po instalacji zobaczysz zależność IronOCR w sekcji "zależności" w Eksploratorze rozwiązań.
Po zainstalowaniu będziesz mógł używać biblioteki bez żadnego oprogramowania firm trzecich. Następnie czas skonfigurować front-end naszego programu.
Przykład kodu: język japoński dla OCR
Nadszedł czas, aby napisać kod do implementacji biblioteki IronOCR dla języka japońskiego. Najpierw musimy stworzyć front-end do wyboru pliku obrazu. Przyjrzyjmy się, jak to zrobić.
Rozwój Frontendu
Dla rozwoju front-endu wykorzystamy "Narzędziownik" w Visual Studio. Ma wiele gotowych elementów, które możemy wykorzystać do zaprojektowania naszego front-endu. Użyjemy pola z obrazkiem, bogatego pola tekstowego, przycisku i dwóch etykiet do identyfikacji. Nadamy tym elementom odpowiedni kształt i dobry interfejs użytkownika zgodnie z naszymi potrzebami. Możesz zmienić rozmiar i właściwości elementów według własnego uznania. Wyjściowe pole tekstowe jest nieedytowalne, a właściwość obrazu pola z obrazkiem to "Zoom", dzięki czemu każdy obrazek będzie pasował do pola z obrazkiem. Nasz frontend będzie wyglądał tak:
Kod backendowy dla IronOCR
Nasz front-end jest gotowy. Teraz czas, aby ożywić go. Ale najpierw musimy zaimportować przestrzeń nazw IronOCR, aby móc używać IronOCR w naszym kodzie. Napisz następującą linię na początku pliku:
using IronOCR;
using IronOCR;
Imports IronOCR
Przycisk "Wybierz obraz" będzie służył do wybierania japońskich obrazów. Kiedy wybierzemy obraz, automatycznie załaduje się do pola z obrazkiem i będzie widoczny. Jednocześnie IronOCR zacznie rozpoznawać japońskie słowa z wgranych obrazów. Po zakończeniu procesu wynik pojawi się w bogatym polu tekstowym. Dodajmy te funkcje do przycisku, klikając na niego dwukrotnie. Oto przykład kodu dla funkcjonalności przycisku. Zapisze także tekst wyjściowy do pliku "txt".
private void btn_image_Click(object sender, EventArgs e)
{
OpenFileDialog open = new OpenFileDialog();
// Display the image selection dialog, and upon successful image selection, proceed
if (open.ShowDialog() == DialogResult.OK)
{
// Display selected image in the picture box
img_image.Image = new Bitmap(open.FileName);
// Initialize IronTesseract for OCR processing
var Ocr = new IronTesseract
{
// Set the OCR language to JapaneseBest for optimal accuracy
Language = OcrLanguage.JapaneseBest
};
// Using 'OcrInput' to process the selected image file
using (var Input = new OcrInput(open.FileName))
{
// Perform OCR to extract text from the image
var Result = Ocr.Read(Input);
// Display recognized text in the rich text box
txt_output.Text = Result.Text;
// Save the output as a text file named "JapaneseText.txt"
Result.SaveAsTextFile("JapaneseText.txt");
}
}
}
private void btn_image_Click(object sender, EventArgs e)
{
OpenFileDialog open = new OpenFileDialog();
// Display the image selection dialog, and upon successful image selection, proceed
if (open.ShowDialog() == DialogResult.OK)
{
// Display selected image in the picture box
img_image.Image = new Bitmap(open.FileName);
// Initialize IronTesseract for OCR processing
var Ocr = new IronTesseract
{
// Set the OCR language to JapaneseBest for optimal accuracy
Language = OcrLanguage.JapaneseBest
};
// Using 'OcrInput' to process the selected image file
using (var Input = new OcrInput(open.FileName))
{
// Perform OCR to extract text from the image
var Result = Ocr.Read(Input);
// Display recognized text in the rich text box
txt_output.Text = Result.Text;
// Save the output as a text file named "JapaneseText.txt"
Result.SaveAsTextFile("JapaneseText.txt");
}
}
}
Private Sub btn_image_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim open As New OpenFileDialog()
' Display the image selection dialog, and upon successful image selection, proceed
If open.ShowDialog() = DialogResult.OK Then
' Display selected image in the picture box
img_image.Image = New Bitmap(open.FileName)
' Initialize IronTesseract for OCR processing
Dim Ocr = New IronTesseract With {.Language = OcrLanguage.JapaneseBest}
' Using 'OcrInput' to process the selected image file
Using Input = New OcrInput(open.FileName)
' Perform OCR to extract text from the image
Dim Result = Ocr.Read(Input)
' Display recognized text in the rich text box
txt_output.Text = Result.Text
' Save the output as a text file named "JapaneseText.txt"
Result.SaveAsTextFile("JapaneseText.txt")
End Using
End If
End Sub
W tej funkcji, kiedy użytkownik kliknie przycisk, pojawi się okno dialogowe wyboru, które zaprosi użytkownika do wybrania obrazu zawierającego tekst w języku japońskim. Kiedy użytkownik wybierze obraz, funkcja Bitmap pobierze ścieżkę obrazu i załaduje go do pola z obrazkiem. Po załadowaniu inicjalizujemy bibliotekę IronOCR i ustawiamy język na japoński. IronOCR przyjmuje ścieżkę obrazu jako wejście i rozpoczyna skanowanie. Po skanowaniu zapisuje tekst wyjściowy w zmiennej Result i wyświetla go jako wynik w bogatym polu tekstowym. Na koniec zapisuje plik wynikowy jako plik "txt" o nazwie "JapaneseText".
Uruchom projekt
Zaprojektowaliśmy kod i zaimplementowaliśmy backend. Teraz czas uruchomić program, aby sprawdzić, czy funkcja działa dobrze.
- Kliknij zielony przycisk odtwarzania, aby uruchomić projekt. Zobaczymy ten ekran pośrodku ekranu naszego systemu operacyjnego.
- Kliknij przycisk "Wybierz obraz" i wybierz obraz zawierający tekst w języku japońskim.
- Zobaczysz tekst wyjściowy obrazka w bogatym polu tekstowym.
- Plik tekstowy z wynikiem OCR zostanie zapisany jako "JapaneseText."
Dokładność OCR w IronOCR jest doskonała.
Podsumowanie
W tym samouczku nauczyliśmy się, jak używać biblioteki IronOCR do tekstu w języku japońskim. Jeśli chcesz dowiedzieć się więcej o IronOCR, kliknij ten link.
Więcej informacji o Iron Software można znaleźć klikając na ten link. Jeśli chcesz wypróbować bibliotekę IronOCR, możesz aktywować darmowy okres próbny bez żadnych opłat. Iron Software obecnie oferuje specjalną ofertę, w której można kupić pakiet pięciu produktów oprogramowania w cenie tylko dwóch. Aby uzyskać więcej informacji, kliknij tutaj.

