Tamil OCR in C# and .NET
Andere Versionen dieses Dokuments:
IronOCR ist eine C# Softwarekomponente, die es .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Tamil, zu lesen.
Es ist eine fortschrittliche Abspaltung von Tesseract, die ausschließlich for .NET-Entwickler gebaut wurde und regelmäßig andere Tesseract-Engines sowohl in Geschwindigkeit als auch Genauigkeit übertrifft.
Inhalte von IronOcr.Languages.Tamil
Dieses Paket enthält 102 OCR-Sprachen for .NET:
- Tamil
- TamilBest
- TamilFast
- TamilAlphabet
- TamilAlphabetBest
- TamilAlphabetFast
Download
Tamil Sprachpaket [தமிழ]
Installation
Das erste, was wir tun müssen, ist unser Tamil OCR-Paket in Ihr .NET-Projekt zu installieren.
Install-Package IronOcr.Languages.Tamil
Beispielcode
Dieses C#-Codebeispiel liest Tamiltext aus einem Bild oder PDF-Dokument.
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the recognized text
var AllText = Result.Text;
// Display the recognized text (for example purpose)
Console.WriteLine(AllText);
}
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the recognized text
var AllText = Result.Text;
// Display the recognized text (for example purpose)
Console.WriteLine(AllText);
}
Imports IronOcr
' Ensure IronOcr.Languages.Tamil package is installed
Dim Ocr As New IronTesseract()
' Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil
Using Input As New OcrInput("images\Tamil.png")
' Perform OCR on the input image
Dim Result = Ocr.Read(Input)
' Get the recognized text
Dim AllText = Result.Text
' Display the recognized text (for example purpose)
Console.WriteLine(AllText)
End Using
- Die Klasse
IronTesseractwird zum Initialisieren und Einrichten der OCR-Engine verwendet. - Die Eigenschaft
Ocr.Languagegibt das für die OCR zu verwendende Sprachpaket an. - Die Klasse
OcrInputwird mit dem Pfad zur Bilddatei verwendet, die tamilischen Text enthält. - Die
Ocr.Read()-Methode verarbeitet das Bild und extrahiert den Text. - Schließlich wird der erkannte Text in
AllTextgespeichert und kann bei Bedarf verwendet werden.

