Japanese OCR in C# and .NET
**Bu belgenin diğer sürümleri: 日本語で
IronOCR, .NET kodlayıcılarının görüntülerden ve PDF belgelerinden, Japonca dahil 126 dilde metin okumasını sağlayan bir C# yazılım bileşenidir. Tesseract'ın, yalnızca .NET geliştiricileri için özel olarak oluşturulmuş gelişmiş bir dalıdır ve hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakır.
Birçok farklı donanım platformunda test edilmiş ve yazılım kütüphanesi en son .NET sürümüne güncellenmiştir. Uygulama veya projelerinde OCR yapmak zorunda olan geliştiriciler için iyi bir seçenektir. IronOCR, uygulama geliştiricilere birçok dili destekleyen ve çeşitli yollarla uygulamalara entegre edilebilen kullanımı kolay bir API sağlar. IronOCR, 125 OCR dilini destekler. Bu, harika bir OCR aracıdır.
IronOcr.Languages.Japanese İçeriği
IronOCR Japonca paketi çok çeşitli işlemler yapar. Bu paket, .NET için birkaç OCR dilini içerir:
- Japonca Alfabe
- JaponcaAlfabeEnİyi
- Japonca AlfabeFast
- JaponcaDikeyAlfabe
- JaponcaDikeyAlfabeEnİyi
- JaponcaDikeyAlfabeFast
- Japonca
- JaponcaEn iyi
- JaponcaFast
- JaponcaDikey
- JaponcaDikeyBest
- JaponcaDikeyFast
İndir
IronOCR Japonca Dil Paketi [日本語 (にほんご)] aşağıdaki bağlantılardan indirilebilir:
- Download as [ Zip ](<a class=)">Zip
- [ NuGet ](<a target=)">NuGet ile yükle
IronOCR yükleme sürecini sonraki bölümlerde inceleyeceğiz.
Japon Dili için IronOCR Kullanımı
C# Projesi Oluşturma veya Açma
Bir C# projesi oluşturarak başlayalım. Visual Studio 2022'yi bir C# projesi oluşturmak için kullanıyoruz — tercihinize göre herhangi bir sürümü seçebilirsiniz. Visual Studio'nun en son sürümü önerilir. Bir C# projesi oluşturmak için aşağıdaki adımları izleyin:
- Visual Studio 2022'yi açın.
- 'Yeni bir proje oluştur' butonuna tıklayın.
- Arama çubuğuna 'Windows' yazın, arama sonuçlarından 'Windows Form' uygulamasını seçin ve 'İleri' butonuna tıklayın.
- Projeye bir isim verin. Projeye 'JapaneseOCR' adını verdim. Adlandırdıktan sonra 'İleri' düğmesine tıklayın.
- Bir sonraki ekranda .NET çerçevesini seçin. Projenizin ihtiyaçlarına göre .NET çerçevesini seçin. Bu eğitim için .NET 5.0 sürümünü seçiyoruz.
- Seçimden sonra 'Oluştur' düğmesine tıklayın. Visual Studio'da kolayca C# Windows Form projesi oluşturulacaktır.
Proje oluşturuldu! Şimdi onu IronOCR kütüphanesinde kullanabiliriz. Ayrıca mevcut bir C# projesiyle de kullanabiliriz. Projeyi açın ve IronOCR kütüphanesinin kurulumuna başlayın. Bu bölüm, IronOCR kütüphanesinin C# projelerinde nasıl kurulacağını açıklar.
Kurulum
Şimdi projemize IronOCR kütüphanesini yükleme zamanıdır. IronOCR kütüphanesi iki farklı şekilde yüklenebilir. IronOCR'i Paket Yöneticisi Konsolu ve NuGet Paket Yöneticisi kullanarak yükleyebiliriz. Her iki yöntemi de inceleyelim.
NuGet Paket Yöneticisi Kullanarak
IronOCR kütüphanesini NuGet Paket Yöneticisi ile kurmak için NuGet Paket Yöneticisi arayüzünü açmalıyız. IronOCR kütüphanesini yüklemek için aşağıdaki adımları izleyin:
- Ana menüden 'Araçlar' üzerine tıklayın, açılır menüden 'NuGet Paket Yöneticisi' üzerine gelin ve 'Çözüme NuGet Paketleri Yönet'i seçin.
- Bu, NuGet Paket Yöneticisi arayüzünü açacaktır. Gezinti sekmesine gidin ve arama çubuğuna 'IronOCR Japanese' yazın. Arama sonuçlarından Japanese paketi seçin ve yüklemeyi başlatmak için 'Kur' düğmesine tıklayın.
- Kütüphane yüklenmeye başlayacak. Yüklemeden sonra projenizde IronOCR kütüphanesini kullanabileceksiniz.
Paket Yöneticisi Konsolunu Kullanarak
Paket Yöneticisi Konsolu kullanarak IronOCR kütüphanesini yükleyeceğiz. Konsol kullanarak kütüphaneyi yüklemek çok basittir. Konsol kullanarak IronOCR kütüphanesini nasıl yükleyebileceğimize bir göz atalım:
- Projeyi açın ve Visual Studio'daki Paket Yöneticisi Konsolu'na gidin. Genellikle Visual Studio'nun alt kısmında bulunur.
-
IronOCR Japonca OCR dilini yüklemek için konsola aşağıdaki komutu yazın:
PM> Install-Package IronOcr.Languages.JapanesePM> Install-Package IronOcr.Languages.JapaneseSHELL - Kurulum başlayacak ve ilerlemeyi konsolda göreceksiniz. Kurulumdan sonra, IronOCR bağımlılığını Solution Explorer'daki 'dependencies' bölümünde göreceksiniz.
Kurulumdan sonra, kütüphaneyi üçüncü taraf bir yazılım olmadan kullanabileceksiniz. Sırada programımızın ön yüzünü kurma zamanı.
Kod Örneği: Japonca Dili için OCR
Şimdi IronOCR kütüphanesini Japonca dili için uygulamak üzere kodu yazma zamanı. İlk olarak, resim dosyasını seçmek için ön yüzü geliştirmemiz gerekiyor. Bunu nasıl yapacağımıza bakalım.
Ön Yüz Geliştirme
Ön yüz geliştirmesi için Visual Studio'daki 'Araç Kutusu'ndan yararlanacağız. Ön yüzümüzü tasarlamak için kullanabileceğimiz birçok önceden yapılmış öğe bulunmaktadır. Tanımlama için resim kutusu, zengin metin kutusu, bir düğme ve iki etiket kullanacağız. Bu öğelere uygun bir şekil ve ihtiyacımıza göre iyi bir kullanıcı arayüzü vereceğiz. Öğelerin boyutunu ve özelliklerini tercihinize göre değiştirebilirsiniz. Çıktı metin kutusunu düzenlenemez yapıyoruz ve resim kutusunun resim özelliği 'Zoom', böylece her resim resim kutusuna sığacak. Ön yüzümüz böyle görünecek:
IronOCR için Arka Plan Kodu
Ön yüzümüz hazır. Şimdi bunu canlandırma zamanı. Ancak önce kodumuzda IronOCR kullanabilmek için IronOCR namespace'i içe aktarmamız gerekiyor. Dosyanın üstüne aşağıdaki satırı yazın:
using IronOCR;
using IronOCR;
Imports IronOCR
'Görsel Seç' düğmesi Japonca görselleri seçmek için kullanılacak. Görseli seçtiğimizde, otomatik olarak resim kutusuna yüklenecek ve görülecektir. Aynı zamanda, IronOCR yüklenen görsellerden Japonca kelimeleri tanımaya başlayacak. İşlem tamamlandıktan sonra çıktı zengin metin kutusunda gösterilecektir. Düğmeye çift tıklayarak bu işlevleri ekleyelim. Düğme işlevselliği için kod örneği burada. Ayrıca çıktı metnini 'txt' dosyasına kaydedecek.
private void btn_image_Click(object sender, EventArgs e)
{
OpenFileDialog open = new OpenFileDialog();
// Display the image selection dialog, and upon successful image selection, proceed
if (open.ShowDialog() == DialogResult.OK)
{
// Display selected image in the picture box
img_image.Image = new Bitmap(open.FileName);
// Initialize IronTesseract for OCR processing
var Ocr = new IronTesseract
{
// Set the OCR language to JapaneseBest for optimal accuracy
Language = OcrLanguage.JapaneseBest
};
// Using 'OcrInput' to process the selected image file
using (var Input = new OcrInput(open.FileName))
{
// Perform OCR to extract text from the image
var Result = Ocr.Read(Input);
// Display recognized text in the rich text box
txt_output.Text = Result.Text;
// Save the output as a text file named "JapaneseText.txt"
Result.SaveAsTextFile("JapaneseText.txt");
}
}
}
private void btn_image_Click(object sender, EventArgs e)
{
OpenFileDialog open = new OpenFileDialog();
// Display the image selection dialog, and upon successful image selection, proceed
if (open.ShowDialog() == DialogResult.OK)
{
// Display selected image in the picture box
img_image.Image = new Bitmap(open.FileName);
// Initialize IronTesseract for OCR processing
var Ocr = new IronTesseract
{
// Set the OCR language to JapaneseBest for optimal accuracy
Language = OcrLanguage.JapaneseBest
};
// Using 'OcrInput' to process the selected image file
using (var Input = new OcrInput(open.FileName))
{
// Perform OCR to extract text from the image
var Result = Ocr.Read(Input);
// Display recognized text in the rich text box
txt_output.Text = Result.Text;
// Save the output as a text file named "JapaneseText.txt"
Result.SaveAsTextFile("JapaneseText.txt");
}
}
}
Private Sub btn_image_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim open As New OpenFileDialog()
' Display the image selection dialog, and upon successful image selection, proceed
If open.ShowDialog() = DialogResult.OK Then
' Display selected image in the picture box
img_image.Image = New Bitmap(open.FileName)
' Initialize IronTesseract for OCR processing
Dim Ocr = New IronTesseract With {.Language = OcrLanguage.JapaneseBest}
' Using 'OcrInput' to process the selected image file
Using Input = New OcrInput(open.FileName)
' Perform OCR to extract text from the image
Dim Result = Ocr.Read(Input)
' Display recognized text in the rich text box
txt_output.Text = Result.Text
' Save the output as a text file named "JapaneseText.txt"
Result.SaveAsTextFile("JapaneseText.txt")
End Using
End If
End Sub
Bu işlevde, kullanıcı düğmeye tıkladığında, Japonca metin içeren bir görsel seçmesini isteyen bir seçim dialog kutusu çıkacak. Kullanıcı görseli seçtiğinde, Bitmap işlevi görsel yolunu alır ve resim kutusuna yükler. Yüklendikten sonra, IronOCR kütüphanesini başlatırız ve dili Japonca olarak ayarlarız. IronOCR görsel yolunu girdi olarak alır ve taramaya başlar. Taramadan sonra, çıktı metnini Result değişkeninde depolar ve zengin metin kutusunda çıktı olarak gösterir. Son olarak, çıktıyı 'JapaneseText' adında bir 'txt' dosyası olarak kaydeder.
Projeyi Çalıştırın
Kodu tasarladık ve arka planı uyguladık. Şimdi işlevselliğin iyi çalışıp çalışmadığını görmek için programı çalıştırma zamanı.
- Projeyi çalıştırmak için yeşil oynat düğmesine tıklayın. Bu ekranı işletim sistemlerimizin ekranlarının ortasında göreceğiz.
- 'Görsel Seç' düğmesine tıklayın ve Japonca metin içeren görseli seçin.
- Zengin metin kutusunda çıktı görsel metnini göreceksiniz.
- OCR sonucunun metin dosyası 'JapaneseText' olarak kaydedilecektir.
IronOCR'un OCR doğruluğu mükemmeldir.
Özet
Bu öğreticide, IronOCR kütüphanesini Japonca metin için nasıl kullanacağımızı öğrendik. IronOCR hakkında daha fazla bilgi edinmek istiyorsanız, lütfen bu bağlantıya tıklayın.
Iron Software hakkında daha fazla bilgi için lütfen bu bağlantıya tıklayın. IronOCR kütüphanesini denemek istiyorsanız, herhangi bir ödeme yapmadan ücretsiz deneme sürümünü etkinleştirebilirsiniz. Iron Software şu anda beş yazılım ürününden oluşan bir paketi sadece iki fiyata alabileceğiniz özel bir teklif sunuyor. Daha fazla bilgi için, lütfen buraya tıklayın.

