Bulgarian OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
このドキュメントの他のバージョン:

*ブルガリア語

IronOCR は、.NET コーダーがブルガリア語を含む 126 の言語で画像や PDF ドキュメントからテキストを読み取ることを可能にする C# ソフトウェア コンポーネントです。

これは Tesseract の高度なフォークであり、.NET 開発者専用に構築されており、速度と精度の両方で他の Tesseract エンジンを常に上回っています。

IronOcr.Languages.Bulgarian の内容

このパッケージには、.NET 用の 52 の OCR 言語が含まれています。

  • ブルガリア語
  • ブルガリアベスト
  • ブルガリアファースト

ダウンロード

ブルガリア語言語パック[ブルガリア語]

  • Zip形式でダウンロード
  • NuGetでインストール

インストール

最初に、ブルガリア語のOCR パッケージを .NET プロジェクトにインストールする必要があります。

Install-Package IronOcr.Languages.Bulgarian

Code Example

この C# コード例は、画像または PDF ドキュメントからブルガリア語のテキストを読み取ります。

// Ensure you have installed the IronOCR language package for Bulgarian
// PM> Install-Package IronOcr.Languages.Bulgarian

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Bulgarian
Ocr.Language = OcrLanguage.Bulgarian;

// Load the image or PDF document containing Bulgarian text
using (var Input = new OcrInput(@"images\Bulgarian.png"))
{
    // Perform OCR and obtain the result
    var Result = Ocr.Read(Input);

    // Extract all the text from the OCR result
    var AllText = Result.Text;

    // Optionally, print or use the extracted text as needed
    Console.WriteLine(AllText);
}
// Ensure you have installed the IronOCR language package for Bulgarian
// PM> Install-Package IronOcr.Languages.Bulgarian

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Bulgarian
Ocr.Language = OcrLanguage.Bulgarian;

// Load the image or PDF document containing Bulgarian text
using (var Input = new OcrInput(@"images\Bulgarian.png"))
{
    // Perform OCR and obtain the result
    var Result = Ocr.Read(Input);

    // Extract all the text from the OCR result
    var AllText = Result.Text;

    // Optionally, print or use the extracted text as needed
    Console.WriteLine(AllText);
}
$vbLabelText   $csharpLabel

この例では:

  • OCR 操作を実行するために、IronTesseract オブジェクトを作成します。
  • OcrLanguage.Bulgarian を使用して、OCR の言語をブルガリア語に設定しました。
  • 画像ファイル Bulgarian.pngOcrInput オブジェクトに読み込みます。
  • 画像からテキストを抽出するには、Ocr.Read(Input) を使用します。
  • 最後に、抽出されたテキストは Result.Text を使用してアクセスされます。