C# 和 .NET 中的馬拉雅拉姆文光學字符識別
IronOCR 是一個 C# 軟件組件,允許 .NET 程序員從圖像和 PDF 文件中讀取 126 種語言的文本,包括馬拉雅拉姆語。
它是 Tesseract 的一個高級分支,專為 .NET 開發者打造,無論在速度還是準確性上,都經常超越其他 Tesseract 引擎。
IronOcr.Languages.Malayalam 的內容
此套件包含 126 種 OCR 語言適用於 .NET:
Malayalam
MalayalamBest
MalayalamFast
MalayalamAlphabet
MalayalamAlphabetBest
MalayalamAlphabetFast
下載
馬拉雅拉姆語語言包 [馬來亞拉姆語]
安裝
我們需要做的第一件事是將我們的馬拉雅拉姆語 OCR 套件安裝到您的 .NET 項目中。
PM> Install-Package IronOCR.Languages.Malayalam
範例程式碼
此C#程式碼範例從圖片或PDF文件中讀取馬拉雅拉姆文文字。
//PM> Install-Package IronOcr.Languages.Malayalam
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Malayalam;
using (var Input = new OcrInput(@"images\Malayalam.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
//PM> Install-Package IronOcr.Languages.Malayalam
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Malayalam;
using (var Input = new OcrInput(@"images\Malayalam.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
'PM> Install-Package IronOcr.Languages.Malayalam
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Malayalam
Using Input = New OcrInput("images\Malayalam.png")
Dim Result = Ocr.Read(Input)
Dim AllText = Result.Text
End Using