Tamil OCR in C# and .NET
Outras versões deste documento:
O IronOCR é um componente de software em C# que permite aos programadores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo o tâmil.
Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET e que supera regularmente outros mecanismos do Tesseract em termos de velocidade e precisão.
Conteúdo de IronOcr.Languages.Tamil
Este pacote contém 102 linguagens de OCR for .NET:
- Tâmil
- TâmilBest
- TâmilFast
- Alfabeto Tamil
- Alfabeto TamilBest
- Alfabeto TamilFast
Baixar
Pacote de idioma Tamil [தமிழ]
Instalação
A primeira coisa que precisamos fazer é instalar nosso pacote OCR Tamil em seu projeto .NET.
Install-Package IronOcr.Languages.Tamil
Exemplo de código
Este exemplo de código C# lê texto em tâmil a partir de uma imagem ou documento PDF.
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the recognized text
var AllText = Result.Text;
// Display the recognized text (for example purpose)
Console.WriteLine(AllText);
}
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the recognized text
var AllText = Result.Text;
// Display the recognized text (for example purpose)
Console.WriteLine(AllText);
}
Imports IronOcr
' Ensure IronOcr.Languages.Tamil package is installed
Dim Ocr As New IronTesseract()
' Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil
Using Input As New OcrInput("images\Tamil.png")
' Perform OCR on the input image
Dim Result = Ocr.Read(Input)
' Get the recognized text
Dim AllText = Result.Text
' Display the recognized text (for example purpose)
Console.WriteLine(AllText)
End Using
- A classe
IronTesseracté usada para inicializar e configurar o mecanismo de OCR. - A propriedade
Ocr.Languageespecifica o pacote de idiomas a ser usado para OCR. - A classe
OcrInputé usada com o caminho para o arquivo de imagem contendo texto em Tamil. - O método
Ocr.Read()processa a imagem e extrai o texto. - Finalmente, o texto reconhecido é armazenado em
AllTexte pode ser utilizado conforme necessário.

