Thaana Alphabet OCR in C#

This article was translated from English: Does it need improvement?
Translated
View the article in English

126 Weitere Sprachen

IronOCR ist eine C#-Softwarekomponente, die es .NET-Programmierern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich des Thaana-Alphabets, zu lesen.

Es ist eine fortschrittliche Abspaltung von Tesseract, die ausschließlich für .NET-Entwickler gebaut wurde und regelmäßig andere Tesseract-Engines sowohl in Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalte von IronOcr.Languages.Thaana

Dieses Paket enthält 67 OCR-Sprachen für .NET:

  • ThaanaAlphabet
  • ThaanaAlphabetBest
  • ThaanaAlphabetFast

Download

Thaana Alphabet Sprachpaket style='white-space:default'>[Thaana]

Installation

Das Erste, was wir tun müssen, ist, unser Thaana Alphabet OCR-Paket in Ihr .NET-Projekt zu installieren.

Install-Package IronOCR.Languages.Thaana

Beispielcode

Dieses C#-Codebeispiel liest Text im Thaana-Alphabet aus einem Bild oder PDF-Dokument.

// Import the IronOcr namespace
using IronOcr;

// Create a new IronTesseract OCR object
var Ocr = new IronTesseract();

// Set the language to Thaana for OCR processing
Ocr.Language = OcrLanguage.Thaana;

// Create an OcrInput object with the path to the image
using (var Input = new OcrInput(@"images\Thaana.png"))
{
    // Perform OCR on the input image to extract text
    var Result = Ocr.Read(Input);

    // Store the recognized text from the image in a variable
    var AllText = Result.Text;

    // Output the recognized text to the console or any other use
    Console.WriteLine(AllText);
}
// Import the IronOcr namespace
using IronOcr;

// Create a new IronTesseract OCR object
var Ocr = new IronTesseract();

// Set the language to Thaana for OCR processing
Ocr.Language = OcrLanguage.Thaana;

// Create an OcrInput object with the path to the image
using (var Input = new OcrInput(@"images\Thaana.png"))
{
    // Perform OCR on the input image to extract text
    var Result = Ocr.Read(Input);

    // Store the recognized text from the image in a variable
    var AllText = Result.Text;

    // Output the recognized text to the console or any other use
    Console.WriteLine(AllText);
}
' Import the IronOcr namespace
Imports IronOcr

' Create a new IronTesseract OCR object
Private Ocr = New IronTesseract()

' Set the language to Thaana for OCR processing
Ocr.Language = OcrLanguage.Thaana

' Create an OcrInput object with the path to the image
Using Input = New OcrInput("images\Thaana.png")
	' Perform OCR on the input image to extract text
	Dim Result = Ocr.Read(Input)

	' Store the recognized text from the image in a variable
	Dim AllText = Result.Text

	' Output the recognized text to the console or any other use
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel
  • Der obige Code zeigt, wie IronOCR verwendet wird, um OCR auf einem Bild mit Thaana-Skript durchzuführen.
  • Es richtet ein OCR-Objekt ein, legt die Sprache fest und liest Text aus der angegebenen Bilddatei.
  • Der extrahierte Text kann dann nach Bedarf in Ihrer Anwendung verwendet werden.