C# と .NET でのギリシャ語アルファベット OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

*ギリシャ語のアルファベット

IronOCR は、.NET コーダーがギリシャ語アルファベットを含む 126 の言語で画像や PDF ドキュメントからテキストを読み取ることを可能にする C# ソフトウェア コンポーネントです。

これは、特に.NET開発者向けに構築されたTesseractの高度なフォークであり、速度と精度の両方で他のTesseractエンジンを定期的に上回ります。

IronOcr.Languages.Greek の内容

このパッケージには、.NET 用の 102 個の OCR 言語が含まれています。

  • ギリシャ語
  • ギリシャベスト
  • ギリシャファースト
  • ギリシャ語アルファベット
  • ギリシャ語アルファベットベスト
  • ギリシャ語アルファベット高速

ダウンロード

ギリシャ語アルファベット言語パック[ギリシャ語]

  • Zip形式でダウンロード
  • NuGetでインストール

インストール

最初のステップは、ギリシャ語アルファベットOCR パッケージを .NET プロジェクトにインストールすることです。

Install-Package IronOCR.Languages.Greek

Code Example

この C# コード例は、画像または PDF ドキュメントからギリシャ語アルファベットのテキストを読み取ります。

// Import the IronOcr namespace
using IronOcr;

class GreekOcrExample
{
    static void Main()
    {
        // Initialize the IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the OCR language to Greek
        Ocr.Language = OcrLanguage.Greek;

        // Load the image or PDF containing Greek text
        using (var Input = new OcrInput(@"images\Greek.png"))
        {
            // Perform OCR and get the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Output the recognized text
            System.Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class GreekOcrExample
{
    static void Main()
    {
        // Initialize the IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the OCR language to Greek
        Ocr.Language = OcrLanguage.Greek;

        // Load the image or PDF containing Greek text
        using (var Input = new OcrInput(@"images\Greek.png"))
        {
            // Perform OCR and get the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Output the recognized text
            System.Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel
  • IronTesseract : このクラスは、OCR 操作を実行する役割を担います。
  • OcrInput : このクラスは、OCR 処理用の画像または PDF ファイルを読み込むために使用されます。
  • Ocr.Read() : 入力データに対して OCR を実行し、認識されたテキストを提供するメソッド。

このコードを実行する前に、IronOcr ライブラリとギリシャ語言語パックが .NET プロジェクトに正しくインストールされていることを確認してください。 このコードは、 images/Greek.pngにある画像から抽出したテキストを出力します。