Japanese OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

**Bu belgenin diğer sürümleri: 日本語で

IronOCR, C# yazılım bileşeni olarak, 126 dilde metinleri, Japonca dahil olmak üzere, görseller ve PDF belgelerinden okur. Tesseract'ın geliştirilmiş bir dalıdır, yalnızca .NET geliştiricileri için geliştirilmiştir ve hem hız hem de doğruluk bakımından diğer Tesseract motorlarını düzenli olarak geride bırakır.

Birçok farklı donanım platformunda test edilmiştir ve yazılım kütüphanesi en son .NET sürümüne güncellenmiştir. Bu uygulamalarında veya projelerinde OCR gerçekleştirmesi gereken geliştiriciler için iyi bir seçimdir. IronOCR, birçok dil ile çalışan ve çeşitli şekillerde uygulamalara entegre edilebilen kolay kullanımlı bir API sağlar. IronOCR, 125 OCR dilini destekler. Mükemmel bir OCR aracıdır.

IronOcr.Languages.Japanese İçeriği

IronOCR Japonca paketi geniş bir çeşitli işlemler gerçekleştirir. Bu paket, .NET için birkaç OCR dili içerir:

  • JapaneseAlphabet
  • JapaneseAlphabetBest
  • JapaneseAlphabetFast
  • JapaneseVerticalAlphabet
  • JapaneseVerticalAlphabetBest
  • JapaneseVerticalAlphabetFast
  • Japanese
  • JapaneseBest
  • JapaneseFast
  • JapaneseVertical
  • JapaneseVerticalBest
  • JapaneseVerticalFast

İndirme

IronOCR Japonca Dil Paketi [日本語 (にほんご)]'ni aşağıdaki bağlantılardan indirebilirsiniz:

  • [ Zip ](<a class=)">Zip olarak indir
  • [ NuGet ](<a target=)">NuGet ile yükle

IronOCR'nin kurulumuna aşağıdaki bölümlerde bakacağız.

Japonca Dil için IronOCR Kullanımı

Bir C# Projesi Oluşturun veya Açın

Bir C# projesi oluşturarak başlayalım. Visual Studio 2022'yi kullanarak bir C# projesi oluşturuyoruz — tercihinize göre herhangi bir sürüm seçebilirsiniz. Visual Studio'nun en güncel sürümü önerilir. Bir C# projesi oluşturmak için aşağıdaki adımları izleyin:

  • Visual Studio 2022'yi açın.
  • 'Yeni proje oluştur' butonuna tıklayın.
Chinese Ocr 1 related to Bir C# Projesi Oluşturun veya Açın
  • 'Windows' arama çubuğuna yazın, arama sonuçlarından 'Windows Form' uygulamasını seçin ve 'İleri' butonuna tıklayın.
Chinese Ocr 2 related to Bir C# Projesi Oluşturun veya Açın
  • Projeye bir ad verin. Projeyi 'JapaneseOCR' olarak adlandırdım. Adlandırıldıktan sonra 'İleri' düğmesine tıklayın.
Japanese Ocr 1 related to Bir C# Projesi Oluşturun veya Açın
  • Sonraki ekranda .NET framework'ü seçin. Projenizin ihtiyaçlarına göre .NET framework'ü seçin. Bu kılavuz için .NET 5.0 sürümünü seçiyoruz.
Chinese Ocr 4 related to Bir C# Projesi Oluşturun veya Açın
  • Seçim yaptıktan sonra 'Oluştur' butonuna tıklayın. Visual Studio'da kolayca C# Windows Form projesi oluşturulacaktır.

Proje oluşturuldu! Şimdi onu IronOCR kütüphanemizde kullanabiliriz. Ayrıca varolan bir C# projesinde de kullanabiliriz. Projeyi açın ve IronOCR kütüphanesinin kurulumuna başlayın. Aşağıdaki bölüm, C# projelerinde IronOCR kütüphanesinin nasıl kurulacağını açıklar.

Kurulum

Şimdi, projemizde IronOCR kütüphanesini kurma zamanı. IronOCR kütüphanesi iki farklı yolla kurulabilir. IronOCR'yi Paket Yöneticisi Konsolu ve NuGet Paket Yöneticisi kullanarak kurabiliriz. Her iki yönteme de bir göz atalım.

NuGet Paket Yöneticisi Kullanarak

NuGet Paket Yöneticisi ile IronOCR kütüphanesini yüklemek için NuGet Paket Yöneticisi arayüzünü açmalıyız. IronOCR kütüphanesini yüklemek için aşağıdaki adımları izleyin:

  • Ana menüden 'Araçlar' üzerine tıklayın, açılır menüden 'NuGet Paket Yöneticisi' üzerine gelin ve 'Çözüm için NuGet Paketlerini Yönet'i seçin.
Chinese Ocr 5 related to NuGet Paket Yöneticisi Kullanarak
  • Bu, NuGet Paket Yöneticisi arayüzünü açacaktır. Tarama sekmesine gidin ve arama çubuğuna 'IronOCR Japanese' yazın. Arama sonuçlarından Japonca paketini seçin ve kurulumun başlaması için 'Yükle' düğmesine tıklayın.
Japanese Ocr 2 related to NuGet Paket Yöneticisi Kullanarak
  • Kütüphane yüklenmeye başlayacak. Kurulumdan sonra projenizde IronOCR kütüphanesini kullanabileceksiniz.

Paket Yöneticisi Konsolu Kullanarak

IronOCR kütüphanesini Paket Yöneticisi Konsolu kullanarak kuracağız. Kütüphaneyi konsol kullanarak kurmak oldukça basittir. Konsol kullanarak IronOCR kütüphanesini nasıl kurabileceğimize bir göz atalım:

  • Projeyi açın ve Visual Studio'daki Paket Yöneticisi Konsolu'na gidin. Genellikle Visual Studio'nun alt kısmında bulunur.
  • Konsolda IronOCR Japonca OCR dilini kurmak için aşağıdaki komutu yazın:

    PM> Install-Package IronOcr.Languages.Japanese
    PM> Install-Package IronOcr.Languages.Japanese
    SHELL
  • Kurulum başlayacak ve ilerlemeyi konsolda göreceksiniz. Kurulumdan sonra, Çözüm Gezgini'nde 'bağımlılıklar' bölümünde IronOCR bağımlılığını göreceksiniz.

Kurulumdan sonra, herhangi bir üçüncü taraf yazılım olmadan kütüphaneyi kullanabileceksiniz. Sonraki adım, programımızın ön yüzünü kurma zamanı.

Kod Örneği: OCR için Japonca Dil

Şimdi, Japonca dil için IronOCR kütüphanesini uygulamak için kodu yazma zamanı. Öncelikle, görüntü dosyasını seçmek için ön yüzü geliştirmeliyiz. Bunu nasıl yapacağımıza bir bakalım.

Ön Yüz Geliştirme

Ön yüz geliştirme için Visual Studio'daki 'Araç Kutusu'ndan yararlanacağız. Tasarımımızda kullanabileceğimiz birçok önceden yapılmış eleman bulunur. Bir resim kutusu, zengin metin kutusu, bir düğme ve tanımlama için iki etiket kullanacağız. Bu elemanlara uygun bir şekil ve ihtiyaçlarımıza göre iyi bir kullanıcı arayüzü vereceğiz. Boyutunu ve özelliklerini tercihinize göre değiştirebilirsiniz. Çıktı metin kutusunu düzenlenemez hale getiriyoruz ve resim kutusunun resim özelliği 'Zoom'dur, bu nedenle her resim resim kutusuna sığar. Ön yüzümüz şöyle görünecek:

Japanese Ocr 3 related to Ön Yüz Geliştirme

IronOCR için Arka Uç Kodu

Ön yüzümüz hazır. Şimdi onu canlı hale getirme zamanı. Ancak önce, kodumuzda IronOCR kullanmak için IronOCR ad alanını içe aktarmalıyız. Dosyanın en üstüne şu satırı yazın:

using IronOCR;
using IronOCR;
Imports IronOCR
$vbLabelText   $csharpLabel

'Görüntü Seç' düğmesi, Japonca görüntüleri seçmek için kullanılacaktır. Görüntüyü seçtiğimizde, otomatik olarak resim kutusuna yüklenecek ve görünür olacaktır. Aynı zamanda, IronOCR yüklenen görüntülerden Japonca kelimeleri tanımaya başlayacaktır. İşlem tamamlandıktan sonra, çıktı zengin metin kutusunda görüntülenecek. Bu işlevsellikleri düğmeye çift tıklayarak ekleyelim. İşte düğmenin işlevselliği için örnek kod. Ayrıca çıktıyı bir 'txt' dosyasına kaydedecektir.

private void btn_image_Click(object sender, EventArgs e)
{
    OpenFileDialog open = new OpenFileDialog();

    // Display the image selection dialog, and upon successful image selection, proceed
    if (open.ShowDialog() == DialogResult.OK)
    {
        // Display selected image in the picture box
        img_image.Image = new Bitmap(open.FileName);

        // Initialize IronTesseract for OCR processing
        var Ocr = new IronTesseract
        {
            // Set the OCR language to JapaneseBest for optimal accuracy
            Language = OcrLanguage.JapaneseBest
        };

        // Using 'OcrInput' to process the selected image file
        using (var Input = new OcrInput(open.FileName))
        {
            // Perform OCR to extract text from the image
            var Result = Ocr.Read(Input);

            // Display recognized text in the rich text box
            txt_output.Text = Result.Text;

            // Save the output as a text file named "JapaneseText.txt"
            Result.SaveAsTextFile("JapaneseText.txt");
        }
    }
}
private void btn_image_Click(object sender, EventArgs e)
{
    OpenFileDialog open = new OpenFileDialog();

    // Display the image selection dialog, and upon successful image selection, proceed
    if (open.ShowDialog() == DialogResult.OK)
    {
        // Display selected image in the picture box
        img_image.Image = new Bitmap(open.FileName);

        // Initialize IronTesseract for OCR processing
        var Ocr = new IronTesseract
        {
            // Set the OCR language to JapaneseBest for optimal accuracy
            Language = OcrLanguage.JapaneseBest
        };

        // Using 'OcrInput' to process the selected image file
        using (var Input = new OcrInput(open.FileName))
        {
            // Perform OCR to extract text from the image
            var Result = Ocr.Read(Input);

            // Display recognized text in the rich text box
            txt_output.Text = Result.Text;

            // Save the output as a text file named "JapaneseText.txt"
            Result.SaveAsTextFile("JapaneseText.txt");
        }
    }
}
Private Sub btn_image_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim open As New OpenFileDialog()

	' Display the image selection dialog, and upon successful image selection, proceed
	If open.ShowDialog() = DialogResult.OK Then
		' Display selected image in the picture box
		img_image.Image = New Bitmap(open.FileName)

		' Initialize IronTesseract for OCR processing
		Dim Ocr = New IronTesseract With {.Language = OcrLanguage.JapaneseBest}

		' Using 'OcrInput' to process the selected image file
		Using Input = New OcrInput(open.FileName)
			' Perform OCR to extract text from the image
			Dim Result = Ocr.Read(Input)

			' Display recognized text in the rich text box
			txt_output.Text = Result.Text

			' Save the output as a text file named "JapaneseText.txt"
			Result.SaveAsTextFile("JapaneseText.txt")
		End Using
	End If
End Sub
$vbLabelText   $csharpLabel

Bu işlevde, kullanıcı düğmeye tıkladığında, kullanıcıyı Japonca metin içeren bir görüntü seçmeye yönlendiren bir seçme iletişim kutusu görünecektir. Kullanıcı görüntüyü seçince, Bitmap işlevi görüntünün yolunu alır ve görüntü kutusuna yükler. Yükleme işleminden sonra, IronOCR kütüphanesini başlatır ve dili Japonca olarak ayarlarız. IronOCR görüntü yolunu girdi olarak alır ve taramaya başlar. Tarama tamamlandığında, çıktı metnini Result değişkeninde depolar ve bunu zengin metin kutusunda çıktı olarak gösterir. Son olarak, çıktı dosyasını 'JapaneseText' adlı bir 'txt' dosyası olarak kaydeder.

Projeyi Çalıştırın

Kodu tasarladık ve arka ucu uyguladık. Şimdi işlevselliğin iyi çalışıp çalışmadığını kontrol etmek için programı çalıştırma zamanı.

  • Projeyi çalıştırmak için yeşil oynat düğmesine tıklayın. İşletim sistemlerimizin ekranının ortasında bu ekranı göreceğiz.
Japanese Ocr 4 related to Projeyi Çalıştırın
  • 'Görüntü Seç' düğmesine tıklayın ve Japonca metin içeren görüntüyü seçin.
Japanese Ocr 5 related to Projeyi Çalıştırın
  • Zengin metin kutusunda çıktı resim metnini göreceksiniz.
Japanese Ocr 6 related to Projeyi Çalıştırın
  • OCR sonucunun metin dosyası 'JapaneseText' ile kaydedilecektir.
Japanese Ocr 7 related to Projeyi Çalıştırın

IronOCR'nin OCR doğruluğu mükemmeldir.

Özet

Bu eğitimde, Japonca metin için IronOCR kütüphanesinin nasıl kullanılacağını öğrendik. IronOCR hakkında daha fazla bilgi edinmek istiyorsanız, lütfen bu bağlantıya tıklayın.

Iron Software hakkında daha fazla bilgi için lütfen bu bağlantıya tıklayın. IronOCR kütüphanesini denemek isterseniz, ücretsiz denemeyi herhangi bir ödeme yapmadan etkinleştirebilirsiniz. Iron Software şu anda beş yazılım ürününden oluşan bir paketi yalnızca iki ürün fiyatına satın alabileceğiniz özel bir teklif sunuyor. Daha fazla bilgi için lütfen buraya tıklayın.