OCR del alfabeto Thaana en C

This article was translated from English: Does it need improvement?
Translated
View the article in English

126 idiomas más

IronOCR es un componente de software C# que permite a los programadores de .NET leer texto de imágenes y documentos PDF en 126 idiomas, incluido el Alfabeto Thaana.

Es una versión avanzada de Tesseract, construida exclusivamente para desarrolladores de .NET y que supera regularmente a otros motores Tesseract tanto en velocidad como en precisión.

Contenido de IronOcr.Languages.Thana

Este paquete contiene 67 idiomas de OCR para .NET:

  • Alfabeto Thaana
  • Alfabeto Thaana Mejorado
  • Alfabeto Thaana Rápido

Descargar

Paquete de Idioma del Alfabeto Thaana [Thaana]

Instalación

Lo primero que tenemos que hacer es instalar nuestro paquete OCR de Alfabeto Thaana en tu proyecto .NET.

Install-Package IronOCR.Languages.Thaana

Ejemplo de código

Este ejemplo de código C# lee texto del Alfabeto Thaana desde una imagen o documento PDF.

// Import the IronOcr namespace
using IronOcr;

// Create a new IronTesseract OCR object
var Ocr = new IronTesseract();

// Set the language to Thaana for OCR processing
Ocr.Language = OcrLanguage.Thaana;

// Create an OcrInput object with the path to the image
using (var Input = new OcrInput(@"images\Thaana.png"))
{
    // Perform OCR on the input image to extract text
    var Result = Ocr.Read(Input);

    // Store the recognized text from the image in a variable
    var AllText = Result.Text;

    // Output the recognized text to the console or any other use
    Console.WriteLine(AllText);
}
// Import the IronOcr namespace
using IronOcr;

// Create a new IronTesseract OCR object
var Ocr = new IronTesseract();

// Set the language to Thaana for OCR processing
Ocr.Language = OcrLanguage.Thaana;

// Create an OcrInput object with the path to the image
using (var Input = new OcrInput(@"images\Thaana.png"))
{
    // Perform OCR on the input image to extract text
    var Result = Ocr.Read(Input);

    // Store the recognized text from the image in a variable
    var AllText = Result.Text;

    // Output the recognized text to the console or any other use
    Console.WriteLine(AllText);
}
' Import the IronOcr namespace
Imports IronOcr

' Create a new IronTesseract OCR object
Private Ocr = New IronTesseract()

' Set the language to Thaana for OCR processing
Ocr.Language = OcrLanguage.Thaana

' Create an OcrInput object with the path to the image
Using Input = New OcrInput("images\Thaana.png")
	' Perform OCR on the input image to extract text
	Dim Result = Ocr.Read(Input)

	' Store the recognized text from the image in a variable
	Dim AllText = Result.Text

	' Output the recognized text to the console or any other use
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel
  • El código anterior demuestra cómo usar IronOCR para realizar OCR en una imagen que contiene script Thaana.
  • Configura un objeto OCR, especifica el idioma, y lee texto del archivo de imagen especificado.
  • El texto extraído puede ser utilizado según sea necesario en tu aplicación.