C#および.NETにおけるアラビックOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English
他のバージョンのこのドキュメント:
  • بالعربية
  • さらに125のOCR言語

    IronOCRは、.NETプログラマーが126言語(アラビア語を含む)の画像やPDFドキュメントからテキストを読み取ることを可能にするC#ソフトウェアコンポーネントです。

    .NET開発者専用に構築されたTesseractの高度なフォークであり、速度と精度の両面で他のTesseractエンジンを定期的に上回ります。

IronOcr.Languages.Arabicの内容

このパッケージには、.NET用の108のOCR言語が含まれています。

  • アラビア語
  • アラビックベスト
  • アラビックファースト
  • アラビア文字(ArabicAlphabet)
  • アラビックアルファベットベスト
  • アラビアアルファベットファスト

ダウンロード

アラビア語言語パック [العربية]

  • ダウンロード: Zip
  • NuGet を使用してインストール

インストール

最初に行うべきことは、.NETプロジェクトにArabic OCRパッケージをインストールすることです。

PM> Install-Package IronOCR.Languages.Arabic

コード例

このC#コード例は、画像やPDFドキュメントからアラビア語のテキストを読み取ります。

//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var Input = new OcrInput(@"images\Arabic.png"))
{
    var Result = Ocr.Read(Input);
    var AllText =  Result.Text;
}
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var Input = new OcrInput(@"images\Arabic.png"))
{
    var Result = Ocr.Read(Input);
    var AllText =  Result.Text;
}
'PM> Install-Package IronOcr.Languages.Arabic
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using Input = New OcrInput("images\Arabic.png")
	Dim Result = Ocr.Read(Input)
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel