Japanese OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

**Bu belgenin diğer sürümleri: 日本語で

IronOCR, .NET kodlayıcılarının görüntülerden ve PDF belgelerinden, Japonca dahil 126 dilde metin okumasını sağlayan bir C# yazılım bileşenidir. Tesseract'ın, yalnızca .NET geliştiricileri için özel olarak oluşturulmuş gelişmiş bir dalıdır ve hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakır.

Birçok farklı donanım platformunda test edilmiş ve yazılım kütüphanesi en son .NET sürümüne güncellenmiştir. Uygulama veya projelerinde OCR yapmak zorunda olan geliştiriciler için iyi bir seçenektir. IronOCR, uygulama geliştiricilere birçok dili destekleyen ve çeşitli yollarla uygulamalara entegre edilebilen kullanımı kolay bir API sağlar. IronOCR, 125 OCR dilini destekler. Bu, harika bir OCR aracıdır.

IronOcr.Languages.Japanese İçeriği

IronOCR Japonca paketi çok çeşitli işlemler yapar. Bu paket, .NET için birkaç OCR dilini içerir:

  • Japonca Alfabe
  • JaponcaAlfabeEnİyi
  • Japonca AlfabeFast
  • JaponcaDikeyAlfabe
  • JaponcaDikeyAlfabeEnİyi
  • JaponcaDikeyAlfabeFast
  • Japonca
  • JaponcaEn iyi
  • JaponcaFast
  • JaponcaDikey
  • JaponcaDikeyBest
  • JaponcaDikeyFast

İndir

IronOCR Japonca Dil Paketi [日本語 (にほんご)] aşağıdaki bağlantılardan indirilebilir:

  • Download as [ Zip ](<a class=)">Zip
  • [ NuGet ](<a target=)">NuGet ile yükle

IronOCR yükleme sürecini sonraki bölümlerde inceleyeceğiz.

Japon Dili için IronOCR Kullanımı

C# Projesi Oluşturma veya Açma

Bir C# projesi oluşturarak başlayalım. Visual Studio 2022'yi bir C# projesi oluşturmak için kullanıyoruz — tercihinize göre herhangi bir sürümü seçebilirsiniz. Visual Studio'nun en son sürümü önerilir. Bir C# projesi oluşturmak için aşağıdaki adımları izleyin:

  • Visual Studio 2022'yi açın.
  • 'Yeni bir proje oluştur' butonuna tıklayın.
Chinese Ocr 1 related to C# Projesi Oluşturma veya Açma
  • Arama çubuğuna 'Windows' yazın, arama sonuçlarından 'Windows Form' uygulamasını seçin ve 'İleri' butonuna tıklayın.
Chinese Ocr 2 related to C# Projesi Oluşturma veya Açma
  • Projeye bir isim verin. Projeye 'JapaneseOCR' adını verdim. Adlandırdıktan sonra 'İleri' düğmesine tıklayın.
Japanese Ocr 1 related to C# Projesi Oluşturma veya Açma
  • Bir sonraki ekranda .NET çerçevesini seçin. Projenizin ihtiyaçlarına göre .NET çerçevesini seçin. Bu eğitim için .NET 5.0 sürümünü seçiyoruz.
Chinese Ocr 4 related to C# Projesi Oluşturma veya Açma
  • Seçimden sonra 'Oluştur' düğmesine tıklayın. Visual Studio'da kolayca C# Windows Form projesi oluşturulacaktır.

Proje oluşturuldu! Şimdi onu IronOCR kütüphanesinde kullanabiliriz. Ayrıca mevcut bir C# projesiyle de kullanabiliriz. Projeyi açın ve IronOCR kütüphanesinin kurulumuna başlayın. Bu bölüm, IronOCR kütüphanesinin C# projelerinde nasıl kurulacağını açıklar.

Kurulum

Şimdi projemize IronOCR kütüphanesini yükleme zamanıdır. IronOCR kütüphanesi iki farklı şekilde yüklenebilir. IronOCR'i Paket Yöneticisi Konsolu ve NuGet Paket Yöneticisi kullanarak yükleyebiliriz. Her iki yöntemi de inceleyelim.

NuGet Paket Yöneticisi Kullanarak

IronOCR kütüphanesini NuGet Paket Yöneticisi ile kurmak için NuGet Paket Yöneticisi arayüzünü açmalıyız. IronOCR kütüphanesini yüklemek için aşağıdaki adımları izleyin:

  • Ana menüden 'Araçlar' üzerine tıklayın, açılır menüden 'NuGet Paket Yöneticisi' üzerine gelin ve 'Çözüme NuGet Paketleri Yönet'i seçin.
Chinese Ocr 5 related to NuGet Paket Yöneticisi Kullanarak
  • Bu, NuGet Paket Yöneticisi arayüzünü açacaktır. Gezinti sekmesine gidin ve arama çubuğuna 'IronOCR Japanese' yazın. Arama sonuçlarından Japanese paketi seçin ve yüklemeyi başlatmak için 'Kur' düğmesine tıklayın.
Japanese Ocr 2 related to NuGet Paket Yöneticisi Kullanarak
  • Kütüphane yüklenmeye başlayacak. Yüklemeden sonra projenizde IronOCR kütüphanesini kullanabileceksiniz.

Paket Yöneticisi Konsolunu Kullanarak

Paket Yöneticisi Konsolu kullanarak IronOCR kütüphanesini yükleyeceğiz. Konsol kullanarak kütüphaneyi yüklemek çok basittir. Konsol kullanarak IronOCR kütüphanesini nasıl yükleyebileceğimize bir göz atalım:

  • Projeyi açın ve Visual Studio'daki Paket Yöneticisi Konsolu'na gidin. Genellikle Visual Studio'nun alt kısmında bulunur.
  • IronOCR Japonca OCR dilini yüklemek için konsola aşağıdaki komutu yazın:

    PM> Install-Package IronOcr.Languages.Japanese
    PM> Install-Package IronOcr.Languages.Japanese
    SHELL
  • Kurulum başlayacak ve ilerlemeyi konsolda göreceksiniz. Kurulumdan sonra, IronOCR bağımlılığını Solution Explorer'daki 'dependencies' bölümünde göreceksiniz.

Kurulumdan sonra, kütüphaneyi üçüncü taraf bir yazılım olmadan kullanabileceksiniz. Sırada programımızın ön yüzünü kurma zamanı.

Kod Örneği: Japonca Dili için OCR

Şimdi IronOCR kütüphanesini Japonca dili için uygulamak üzere kodu yazma zamanı. İlk olarak, resim dosyasını seçmek için ön yüzü geliştirmemiz gerekiyor. Bunu nasıl yapacağımıza bakalım.

Ön Yüz Geliştirme

Ön yüz geliştirmesi için Visual Studio'daki 'Araç Kutusu'ndan yararlanacağız. Ön yüzümüzü tasarlamak için kullanabileceğimiz birçok önceden yapılmış öğe bulunmaktadır. Tanımlama için resim kutusu, zengin metin kutusu, bir düğme ve iki etiket kullanacağız. Bu öğelere uygun bir şekil ve ihtiyacımıza göre iyi bir kullanıcı arayüzü vereceğiz. Öğelerin boyutunu ve özelliklerini tercihinize göre değiştirebilirsiniz. Çıktı metin kutusunu düzenlenemez yapıyoruz ve resim kutusunun resim özelliği 'Zoom', böylece her resim resim kutusuna sığacak. Ön yüzümüz böyle görünecek:

Japanese Ocr 3 related to Ön Yüz Geliştirme

IronOCR için Arka Plan Kodu

Ön yüzümüz hazır. Şimdi bunu canlandırma zamanı. Ancak önce kodumuzda IronOCR kullanabilmek için IronOCR namespace'i içe aktarmamız gerekiyor. Dosyanın üstüne aşağıdaki satırı yazın:

using IronOCR;
using IronOCR;
Imports IronOCR
$vbLabelText   $csharpLabel

'Görsel Seç' düğmesi Japonca görselleri seçmek için kullanılacak. Görseli seçtiğimizde, otomatik olarak resim kutusuna yüklenecek ve görülecektir. Aynı zamanda, IronOCR yüklenen görsellerden Japonca kelimeleri tanımaya başlayacak. İşlem tamamlandıktan sonra çıktı zengin metin kutusunda gösterilecektir. Düğmeye çift tıklayarak bu işlevleri ekleyelim. Düğme işlevselliği için kod örneği burada. Ayrıca çıktı metnini 'txt' dosyasına kaydedecek.

private void btn_image_Click(object sender, EventArgs e)
{
    OpenFileDialog open = new OpenFileDialog();

    // Display the image selection dialog, and upon successful image selection, proceed
    if (open.ShowDialog() == DialogResult.OK)
    {
        // Display selected image in the picture box
        img_image.Image = new Bitmap(open.FileName);

        // Initialize IronTesseract for OCR processing
        var Ocr = new IronTesseract
        {
            // Set the OCR language to JapaneseBest for optimal accuracy
            Language = OcrLanguage.JapaneseBest
        };

        // Using 'OcrInput' to process the selected image file
        using (var Input = new OcrInput(open.FileName))
        {
            // Perform OCR to extract text from the image
            var Result = Ocr.Read(Input);

            // Display recognized text in the rich text box
            txt_output.Text = Result.Text;

            // Save the output as a text file named "JapaneseText.txt"
            Result.SaveAsTextFile("JapaneseText.txt");
        }
    }
}
private void btn_image_Click(object sender, EventArgs e)
{
    OpenFileDialog open = new OpenFileDialog();

    // Display the image selection dialog, and upon successful image selection, proceed
    if (open.ShowDialog() == DialogResult.OK)
    {
        // Display selected image in the picture box
        img_image.Image = new Bitmap(open.FileName);

        // Initialize IronTesseract for OCR processing
        var Ocr = new IronTesseract
        {
            // Set the OCR language to JapaneseBest for optimal accuracy
            Language = OcrLanguage.JapaneseBest
        };

        // Using 'OcrInput' to process the selected image file
        using (var Input = new OcrInput(open.FileName))
        {
            // Perform OCR to extract text from the image
            var Result = Ocr.Read(Input);

            // Display recognized text in the rich text box
            txt_output.Text = Result.Text;

            // Save the output as a text file named "JapaneseText.txt"
            Result.SaveAsTextFile("JapaneseText.txt");
        }
    }
}
Private Sub btn_image_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim open As New OpenFileDialog()

	' Display the image selection dialog, and upon successful image selection, proceed
	If open.ShowDialog() = DialogResult.OK Then
		' Display selected image in the picture box
		img_image.Image = New Bitmap(open.FileName)

		' Initialize IronTesseract for OCR processing
		Dim Ocr = New IronTesseract With {.Language = OcrLanguage.JapaneseBest}

		' Using 'OcrInput' to process the selected image file
		Using Input = New OcrInput(open.FileName)
			' Perform OCR to extract text from the image
			Dim Result = Ocr.Read(Input)

			' Display recognized text in the rich text box
			txt_output.Text = Result.Text

			' Save the output as a text file named "JapaneseText.txt"
			Result.SaveAsTextFile("JapaneseText.txt")
		End Using
	End If
End Sub
$vbLabelText   $csharpLabel

Bu işlevde, kullanıcı düğmeye tıkladığında, Japonca metin içeren bir görsel seçmesini isteyen bir seçim dialog kutusu çıkacak. Kullanıcı görseli seçtiğinde, Bitmap işlevi görsel yolunu alır ve resim kutusuna yükler. Yüklendikten sonra, IronOCR kütüphanesini başlatırız ve dili Japonca olarak ayarlarız. IronOCR görsel yolunu girdi olarak alır ve taramaya başlar. Taramadan sonra, çıktı metnini Result değişkeninde depolar ve zengin metin kutusunda çıktı olarak gösterir. Son olarak, çıktıyı 'JapaneseText' adında bir 'txt' dosyası olarak kaydeder.

Projeyi Çalıştırın

Kodu tasarladık ve arka planı uyguladık. Şimdi işlevselliğin iyi çalışıp çalışmadığını görmek için programı çalıştırma zamanı.

  • Projeyi çalıştırmak için yeşil oynat düğmesine tıklayın. Bu ekranı işletim sistemlerimizin ekranlarının ortasında göreceğiz.
Japanese Ocr 4 related to Projeyi Çalıştırın
  • 'Görsel Seç' düğmesine tıklayın ve Japonca metin içeren görseli seçin.
Japanese Ocr 5 related to Projeyi Çalıştırın
  • Zengin metin kutusunda çıktı görsel metnini göreceksiniz.
Japanese Ocr 6 related to Projeyi Çalıştırın
  • OCR sonucunun metin dosyası 'JapaneseText' olarak kaydedilecektir.
Japanese Ocr 7 related to Projeyi Çalıştırın

IronOCR'un OCR doğruluğu mükemmeldir.

Özet

Bu öğreticide, IronOCR kütüphanesini Japonca metin için nasıl kullanacağımızı öğrendik. IronOCR hakkında daha fazla bilgi edinmek istiyorsanız, lütfen bu bağlantıya tıklayın.

Iron Software hakkında daha fazla bilgi için lütfen bu bağlantıya tıklayın. IronOCR kütüphanesini denemek istiyorsanız, herhangi bir ödeme yapmadan ücretsiz deneme sürümünü etkinleştirebilirsiniz. Iron Software şu anda beş yazılım ürününden oluşan bir paketi sadece iki fiyata alabileceğiniz özel bir teklif sunuyor. Daha fazla bilgi için, lütfen buraya tıklayın.