C# と .NET でのデーヴァナーガリー文字 OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

他126の言語

IronOCR は、.NET コーダーがデーヴァナーガリー文字を含む 126 の言語で画像や PDF ドキュメントからテキストを読み取ることを可能にする C# ソフトウェア コンポーネントです。 これはTesseractの高度なフォークであり、.NET開発者専用に構築され、速度と精度の両方で他のTesseractエンジンを定期的に上回ります。

IronOcr.Languages.Devanagari の内容

このパッケージには、.NET 用の 79 個の OCR 言語が含まれています。

  • デーヴァナーガリー文字
  • デーヴァナーガリー文字ベスト
  • デーヴァナーガリー文字高速

ダウンロード

デーヴァナーガリー文字言語パック [ナガイル]

  • Zip形式でダウンロード
  • NuGetでインストール

インストール

最初に、 Devanagari Alphabet OCR パッケージを .NET プロジェクトにインストールする必要があります。

Install-Package IronOCR.Languages.Devanagari

Code Example

この C# コード例は、画像または PDF ドキュメントからデーヴァナーガリー文字のテキストを読み取ります。

// Ensure the IronOcr package is installed 
// PM> Install-Package IronOcr.Languages.Devanagari

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari;

// Define the input file
using (var Input = new OcrInput(@"images\Devanagari.png"))
{
    // Process the input file
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
// Ensure the IronOcr package is installed 
// PM> Install-Package IronOcr.Languages.Devanagari

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari;

// Define the input file
using (var Input = new OcrInput(@"images\Devanagari.png"))
{
    // Process the input file
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
' Ensure the IronOcr package is installed 
' PM> Install-Package IronOcr.Languages.Devanagari

Imports IronOcr

Private Ocr = New IronTesseract()
' Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari

' Define the input file
Using Input = New OcrInput("images\Devanagari.png")
	' Process the input file
	Dim Result = Ocr.Read(Input)

	' Extract the recognized text
	Dim AllText = Result.Text

	' Output the recognized text
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel

上記のコード スニペットは次のことを示しています。

  • IronTesseract OCR エンジンの設定。
  • OCR 言語をデーバナーガリー文字に設定します。
  • デーヴァナーガリー文字を含む画像ファイルの読み取り。
  • 認識されたテキストを抽出してコンソールに出力します。