C# 和 .NET 中的卡纳达语 OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR 是一个 C# 软件组件,允许 .NET 程序员从图像和 PDF 文档中读取 126 种语言(包括卡纳达语)的文本。 它是 Tesseract 的一个高级分支,专为 .NET 开发人员构建,在速度和准确性方面通常优于其他 Tesseract 引擎。

IronOcr.Languages.Kannada 的内容

此软件包包含多个适用于 .NET 的卡纳达语 OCR 语言模型:

  • 卡纳达语
  • KannadaBest
  • KannadaFast
  • 卡纳达语字母表
  • KannadaAlphabetBest
  • KannadaAlphabetFast

下载

卡纳达语语言包[卡纳达语]

安装

我们首先需要做的是将Kannada OCR 包安装到您的 .NET 项目中。

Install-Package IronOCR.Languages.Kannada

代码示例

这段 C# 代码示例从图像或 PDF 文档中读取卡纳达语文本。

// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
' Make sure to install the IronOcr.Languages.Kannada package via NuGet
Imports IronOcr

Private Ocr = New IronTesseract With {.Language = OcrLanguage.Kannada}

Using Input = New OcrInput("images\Kannada.png")
	' Perform OCR on the input image
	Dim Result = Ocr.Read(Input)
	' Retrieve all recognized text from the OCR result
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

IronTesseract是 OCR 引擎的一个实例。

  • OcrLanguage.Kannada指定 OCR 应专门针对卡纳达语。
  • OcrInput从指定路径加载图像以进行 OCR 处理。 Read方法处理输入并返回识别出的文本。 最后,识别出的文本存储在AllText中。