Tamil OCR in C# and .NET
Andere Versionen dieses Dokuments:
IronOCR ist eine C# Softwarekomponente, die es .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Tamil, zu lesen.
Es ist eine fortschrittliche Abspaltung von Tesseract, die ausschließlich for .NET-Entwickler gebaut wurde und regelmäßig andere Tesseract-Engines sowohl in Geschwindigkeit als auch Genauigkeit übertrifft.
Inhalte von IronOcr.Languages.Tamil
Dieses Paket enthält 102 OCR-Sprachen for .NET:
- Tamil
- TamilBest
- TamilFast
- TamilAlphabet
- TamilAlphabetBest
- TamilAlphabetFast
Download
Tamil Sprachpaket [தமிழ]
Installation
Das erste, was wir tun müssen, ist unser Tamil OCR-Paket in Ihr .NET-Projekt zu installieren.
Install-Package IronOcr.Languages.Tamil
Beispielcode
Dieses C#-Codebeispiel liest Tamiltext aus einem Bild oder PDF-Dokument.
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the recognized text
var AllText = Result.Text;
// Display the recognized text (for example purpose)
Console.WriteLine(AllText);
}
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the recognized text
var AllText = Result.Text;
// Display the recognized text (for example purpose)
Console.WriteLine(AllText);
}
Imports IronOcr
' Ensure IronOcr.Languages.Tamil package is installed
Dim Ocr As New IronTesseract()
' Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil
Using Input As New OcrInput("images\Tamil.png")
' Perform OCR on the input image
Dim Result = Ocr.Read(Input)
' Get the recognized text
Dim AllText = Result.Text
' Display the recognized text (for example purpose)
Console.WriteLine(AllText)
End Using
Die Klasse IronTesseract dient zur Initialisierung und Einrichtung der OCR-Engine.
- Die Eigenschaft
Ocr.Languagegibt das für die OCR zu verwendende Sprachpaket an. - Die Klasse
OcrInputwird mit dem Pfad zur Bilddatei verwendet, die tamilischen Text enthält. Die MethodeOcr.Read()verarbeitet das Bild und extrahiert den Text. Schließlich wird der erkannte Text inAllTextgespeichert und kann bei Bedarf verwendet werden.

