Uyghur OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Outras versões deste documento:

O IronOCR é um componente de software C# que permite aos programadores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo o uigur.

Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET e que supera regularmente outros mecanismos do Tesseract em termos de velocidade e precisão.

Conteúdo do IronOcr.Idiomas.Uigur

Este pacote contém 43 linguagens OCR for .NET:

  • Uigur
  • UyghurBest
  • Jejum Uigur

Baixar

Pacote de idioma uigur [Uyƣurqə]

Instalação

A primeira coisa que precisamos fazer é instalar nosso pacote OCR uigur em seu projeto .NET .

Install-Package IronOcr.Languages.Uyghur

Exemplo de código

Este exemplo de código C# lê texto uigur de uma imagem ou documento PDF.

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Uyghur. This is necessary to correctly read Uyghur text.
Ocr.Language = OcrLanguage.Uyghur;

// Create an OCR input object from a file. This can be an image or a PDF.
using (var Input = new OcrInput(@"images\Uyghur.png"))
{
    // Perform text recognition on the input data.
    var Result = Ocr.Read(Input);

    // Extract the recognized text from the OCR result.
    var AllText = Result.Text;

    // Additional processing of AllText can be done here.
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Uyghur. This is necessary to correctly read Uyghur text.
Ocr.Language = OcrLanguage.Uyghur;

// Create an OCR input object from a file. This can be an image or a PDF.
using (var Input = new OcrInput(@"images\Uyghur.png"))
{
    // Perform text recognition on the input data.
    var Result = Ocr.Read(Input);

    // Extract the recognized text from the OCR result.
    var AllText = Result.Text;

    // Additional processing of AllText can be done here.
}
$vbLabelText   $csharpLabel