C# と .NET でのウルドゥー語 OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

*ウルドゥー語

IronOCR は、.NET コーダーがウルドゥー語を含む 126 の言語で画像や PDF ドキュメントからテキストを読み取ることを可能にする C# ソフトウェア コンポーネントです。

これはTesseractの高度なフォークであり、.NET開発者専用に構築され、速度と精度の両方で他のTesseractエンジンを定期的に上回ります。

IronOcr.Languages.Urdu の内容

このパッケージには、.NET 用の 37 の OCR 言語が含まれています。

  • ウルドゥー語
  • ウルドゥー語ベスト
  • ウルドゥー語ファースト

ダウンロード

ウルドゥー語言語パック[ウルドゥー語]

  • Zip形式でダウンロード
  • NuGetでインストール

インストール

最初に、.NET プロジェクトにウルドゥー語OCR パッケージをインストールする必要があります。

Install-Package IronOCR.Languages.Urdu

Code Example

この C# コード例は、画像または PDF ドキュメントからウルドゥー語のテキストを読み取ります。

// Install the IronOcr.Languages.Urdu package
using IronOcr;

var Ocr = new IronTesseract(); // Create a new OCR object
Ocr.Language = OcrLanguage.Urdu; // Set the language to Urdu

// Using a block that ensures the Input object gets disposed after use
using (var Input = new OcrInput(@"images\Urdu.png")) 
{
    var Result = Ocr.Read(Input); // Perform OCR on the input
    var AllText = Result.Text; // Extract the recognized text
    // AllText now contains the Urdu text read from the image
}
// Install the IronOcr.Languages.Urdu package
using IronOcr;

var Ocr = new IronTesseract(); // Create a new OCR object
Ocr.Language = OcrLanguage.Urdu; // Set the language to Urdu

// Using a block that ensures the Input object gets disposed after use
using (var Input = new OcrInput(@"images\Urdu.png")) 
{
    var Result = Ocr.Read(Input); // Perform OCR on the input
    var AllText = Result.Text; // Extract the recognized text
    // AllText now contains the Urdu text read from the image
}
$vbLabelText   $csharpLabel