C#および.NETにおけるアラビア文字OCR
他のバージョンのこのドキュメント:
- こちらですが、アラビア語の翻訳は日本語でサポートしておりません。他にご不明な点がございましたらお知らせください。
-
IronOCRは、.NETプログラマーが126言語(アラビア語を含む)の画像やPDFドキュメントからテキストを読み取ることを可能にするC#ソフトウェアコンポーネントです。
.NET開発者専用に構築されたTesseractの高度なフォークであり、速度と精度の両面で他のTesseractエンジンを定期的に上回ります。
IronOcr.Languages.Arabicの内容
このパッケージには、.NET用の108のOCR言語が含まれています。
- アラビア語
- アラビックベスト
- アラビックファースト
- アラビア文字(ArabicAlphabet)
- アラビックアルファベットベスト
- アラビアアルファベットファスト
ダウンロード
アラビア語言語パック [申し訳ございませんが、現在この翻訳は日本語ではなくアラビア語のため、翻訳することができません。翻訳したいコンテンツをもう一度日本語でご提供いただけると、適切に対応いたします。]
インストール
最初に行うべきことは、.NETプロジェクトにアラビア語OCRパッケージをインストールすることです。
PM> Install-Package IronOCR.Languages.Arabic
コード例
このC#コード例は、画像やPDFドキュメントからアラビア語のテキストを読み取ります。
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var Input = new OcrInput(@"images\Arabic.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var Input = new OcrInput(@"images\Arabic.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
'PM> Install-Package IronOcr.Languages.Arabic
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using Input = New OcrInput("images\Arabic.png")
Dim Result = Ocr.Read(Input)
Dim AllText = Result.Text
End Using