アラビア数字

This article was translated from English: Does it need improvement?
Translated
View the article in English

アラビア語、ペルシア語、ウルドゥー語の言語パックはアラビア数字を認識しないのですか?

これはTesseract言語パックの既知の問題です。

次の言語パックは、アラビア数字でこの問題に対処するのに役立つかもしれない:

https://github.com/Shreeshrii/tessdata_arabic

これをIronOCR(アイアンOCR)機能を使ってカスタム言語パックをロードすることができる:

https://ironsoftware.com/csharp/ocr/languages/#custom-language-example

using IronOcr; var Ocr = new IronTesseract();
    Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
    using (var Input = new OcrInput(@"images\image.png"))
    {
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    }
using IronOcr; var Ocr = new IronTesseract();
    Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
    using (var Input = new OcrInput(@"images\image.png"))
    {
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    }
Imports IronOcr
Private Ocr = New IronTesseract()
	Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata")
	Using Input = New OcrInput("images\image.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	End Using
VB   C#