C# と .NET でのオランダ語 OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

*オランダ語

IronOCR は、.NET コーダーがオランダ語を含む 126 の言語で画像や PDF ドキュメントからテキストを読み取ることを可能にする C# ソフトウェア コンポーネントです。

これはTesseractの高度なフォークであり、.NET開発者専用に構築され、速度と精度の両方で他のTesseractエンジンを定期的に上回ります。

IronOcr.Languages.Dutch の内容

このパッケージには.NET用の40のOCR言語が含まれています:

  • オランダ語
  • ダッチベスト
  • ダッチファースト

ダウンロード

オランダ語言語パック[Nederlands]

  • Zip形式でダウンロード
  • NuGetでインストール

インストール

最初に行う必要があるのは、オランダ語OCR パッケージを .NET プロジェクトにインストールすることです。

Install-Package IronOCR.Languages.Dutch

Code Example

この C# コード例は、画像または PDF ドキュメントからオランダ語のテキストを読み取ります。

// The first step is to ensure the IronOcr.Languages.Dutch package is installed.
// You can do this from the Package Manager Console with the command:
// PM> Install-Package IronOcr.Languages.Dutch

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Dutch.
// This is crucial for recognizing text in that language effectively.
Ocr.Language = OcrLanguage.Dutch;

// Use a using statement to manage the OcrInput resource lifecycle.
using (var Input = new OcrInput(@"images\Dutch.png"))
{
    // Read the image and perform OCR to extract text.
    var Result = Ocr.Read(Input);

    // Store the recognized text into a variable.
    var AllText = Result.Text;

    // You can now use the extracted text stored in AllText.
}
// The first step is to ensure the IronOcr.Languages.Dutch package is installed.
// You can do this from the Package Manager Console with the command:
// PM> Install-Package IronOcr.Languages.Dutch

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Dutch.
// This is crucial for recognizing text in that language effectively.
Ocr.Language = OcrLanguage.Dutch;

// Use a using statement to manage the OcrInput resource lifecycle.
using (var Input = new OcrInput(@"images\Dutch.png"))
{
    // Read the image and perform OCR to extract text.
    var Result = Ocr.Read(Input);

    // Store the recognized text into a variable.
    var AllText = Result.Text;

    // You can now use the extracted text stored in AllText.
}
' The first step is to ensure the IronOcr.Languages.Dutch package is installed.
' You can do this from the Package Manager Console with the command:
' PM> Install-Package IronOcr.Languages.Dutch

Imports IronOcr

Private Ocr = New IronTesseract()

' Set the OCR language to Dutch.
' This is crucial for recognizing text in that language effectively.
Ocr.Language = OcrLanguage.Dutch

' Use a using statement to manage the OcrInput resource lifecycle.
Using Input = New OcrInput("images\Dutch.png")
	' Read the image and perform OCR to extract text.
	Dim Result = Ocr.Read(Input)

	' Store the recognized text into a variable.
	Dim AllText = Result.Text

	' You can now use the extracted text stored in AllText.
End Using
$vbLabelText   $csharpLabel

このコードは、オランダ語のテキストを読み取るための OCR プロセスを C# で設定します。 IronTesseractオブジェクトを初期化し、OCR言語を指定し、入力画像ファイルを処理します。結果としてファイルから抽出されたテキストが生成され、必要に応じてアプリケーションで利用できます。