OCR del alfabeto devanagari en C# y .NET
IronOCR es un componente de software C# que permite a los programadores .NET leer texto de imágenes y documentos PDF en 126 idiomas, incluido el alfabeto Devanagari. Es una rama avanzada de Tesseract, construida exclusivamente para desarrolladores de .NET y supera regularmente a otros motores de Tesseract tanto en velocidad como en precisión.
Contenido de IronOcr.Languages.Devanagari
Este paquete contiene 79 idiomas OCR para .NET:
- DevanagariAlphabet
- DevanagariAlphabetBest
- DevanagariAlphabetFast
Descargar
Paquete de idioma del alfabeto Devanagari [Nagair]
Instalación
Lo primero que tenemos que hacer es instalar nuestro paquete OCR de Alfabeto Devanagari en su proyecto .NET.
Install-Package IronOCR.Languages.Devanagari
Ejemplo de código
Este ejemplo de código C# lee texto en alfabeto Devanagari de una imagen o documento PDF.
// Ensure the IronOcr package is installed
// PM> Install-Package IronOcr.Languages.Devanagari
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari;
// Define the input file
using (var Input = new OcrInput(@"images\Devanagari.png"))
{
// Process the input file
var Result = Ocr.Read(Input);
// Extract the recognized text
var AllText = Result.Text;
// Output the recognized text
Console.WriteLine(AllText);
}// Ensure the IronOcr package is installed
// PM> Install-Package IronOcr.Languages.Devanagari
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari;
// Define the input file
using (var Input = new OcrInput(@"images\Devanagari.png"))
{
// Process the input file
var Result = Ocr.Read(Input);
// Extract the recognized text
var AllText = Result.Text;
// Output the recognized text
Console.WriteLine(AllText);
}El fragmento de código anterior demuestra:
- Configuración del motor OCR de IronTesseract.
- Configuración del idioma OCR a Devanagari.
- Lectura de un archivo de imagen que contiene texto en Devanagari.
- Extracción e impresión del texto reconocido en la consola.





