Trabalhando com numerais arábicos no IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Os pacotes de idiomas árabe, persa e urdu não reconhecem numerais arábicos?

Este é um problema conhecido com os pacotes de idiomas do Tesseract.

O pacote de idiomas a seguir pode ajudar a resolver esse problema com numerais arábicos: Tessdata de Shreeshrii em árabe

Isso pode então ser usado com o recurso IronOCR para carregar pacotes de idiomas personalizados: Exemplo de idioma personalizado do IronOCR

using IronOcr;

class ArabicNumeralOCR
{
    static void Main(string[] args)
    {
        // Initialize a new instance of IronTesseract for OCR
        var Ocr = new IronTesseract();

        // Load the custom Tesseract language file for better numeral recognition
        Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");

        // Specify the image input for OCR processing
        using (var Input = new OcrInput(@"images\image.png"))
        {
            // Execute the OCR process on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text
            Console.WriteLine(Result.Text);
        }
    }
}
using IronOcr;

class ArabicNumeralOCR
{
    static void Main(string[] args)
    {
        // Initialize a new instance of IronTesseract for OCR
        var Ocr = new IronTesseract();

        // Load the custom Tesseract language file for better numeral recognition
        Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");

        // Specify the image input for OCR processing
        using (var Input = new OcrInput(@"images\image.png"))
        {
            // Execute the OCR process on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text
            Console.WriteLine(Result.Text);
        }
    }
}
$vbLabelText   $csharpLabel

Nota: Este exemplo em C# demonstra como usar um arquivo de idioma Tesseract personalizado no IronOCR para melhorar o reconhecimento de numerais arábicos em imagens. Pressupõe-se que você já tenha baixado o pacote de idiomas apropriado e o colocado no local especificado. Certifique-se de instalar o IronOCR e adicionar o tratamento de erros necessário no código de produção.

Curtis Chau
Redator Técnico

Curtis Chau é bacharel em Ciência da Computação (Universidade Carleton) e se especializa em desenvolvimento front-end, com experiência em Node.js, TypeScript, JavaScript e React. Apaixonado por criar interfaces de usuário intuitivas e esteticamente agradáveis, Curtis gosta de trabalhar com frameworks modernos e criar manuais ...

Leia mais
Pronto para começar?
Nuget Downloads 5,525,971 | Versão: 2026.3 acaba de ser lançado
Still Scrolling Icon

Ainda está rolando a tela?

Quer provas rápidas? PM > Install-Package IronOcr
executar um exemplo Veja sua imagem se transformar em texto pesquisável.