Arabic OCR in C# and .NET
Outras versões deste documento:
O IronOCR é um componente de software C# que permite aos programadores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo o árabe.
Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET , e que supera regularmente outros mecanismos do Tesseract tanto em velocidade quanto em precisão.
Conteúdo do IronOcr.Idiomas.Árabe
Este pacote contém 108 linguagens OCR for .NET:
- Árabe
- ArabicBest
- Árabe Rápido
- Alfabeto Árabe
- Melhor Alfabeto Árabe
- Alfabeto Árabe Rápido
Baixar
Pacote de Língua Árabe [العربية]
Instalação
A primeira coisa que precisamos fazer é instalar o pacote OCR para árabe no seu projeto .NET .
Install-Package IronOcr.Languages.Arabic
Exemplo de código
Este exemplo de código C# lê texto em árabe a partir de uma imagem ou documento PDF.
// Import the IronOcr namespace to use its classes.
using IronOcr;
// Create a new instance of the IronTesseract class.
var Ocr = new IronTesseract();
// Set the OCR language to Arabic.
Ocr.Language = OcrLanguage.Arabic;
// Use a using statement to ensure that resources are disposed of correctly.
using (var Input = new OcrInput(@"images\Arabic.png"))
{
// Perform OCR on the input image or document.
var Result = Ocr.Read(Input);
// Retrieve all recognized text from the document.
var AllText = Result.Text;
// Optionally, you can output the text to the console or use it otherwise.
// Console.WriteLine(AllText);
}
// Import the IronOcr namespace to use its classes.
using IronOcr;
// Create a new instance of the IronTesseract class.
var Ocr = new IronTesseract();
// Set the OCR language to Arabic.
Ocr.Language = OcrLanguage.Arabic;
// Use a using statement to ensure that resources are disposed of correctly.
using (var Input = new OcrInput(@"images\Arabic.png"))
{
// Perform OCR on the input image or document.
var Result = Ocr.Read(Input);
// Retrieve all recognized text from the document.
var AllText = Result.Text;
// Optionally, you can output the text to the console or use it otherwise.
// Console.WriteLine(AllText);
}
' Import the IronOcr namespace to use its classes.
Imports IronOcr
' Create a new instance of the IronTesseract class.
Private Ocr = New IronTesseract()
' Set the OCR language to Arabic.
Ocr.Language = OcrLanguage.Arabic
' Use a using statement to ensure that resources are disposed of correctly.
Using Input = New OcrInput("images\Arabic.png")
' Perform OCR on the input image or document.
Dim Result = Ocr.Read(Input)
' Retrieve all recognized text from the document.
Dim AllText = Result.Text
' Optionally, you can output the text to the console or use it otherwise.
' Console.WriteLine(AllText);
End Using

