Arabic OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCRは、.NETコーダーがアラビア語を含む126言語の画像やPDF文書からテキストを読み取ることを可能にするC#ソフトウェア・コンポーネントです。

.NET開発者専用に開発されたTesseractの高度なフォークであり、スピードと精度の両方で他のTesseractエンジンを常に上回っています。

IronOcr.Languages.Arabicのコンテンツ

[العربية]。 * Zip としてダウンロードしてください。 * NuGet でインストールしてください。 ## インストール 最初にしなければならないことは、**アラビア語** OCRパッケージを.NETプロジェクトにインストールすることです。 ```shell :InstallCmd Install-Package IronOCR.Languages.Arabic ``` ## コード例 この C# コード例は、画像または PDF 文書からアラビア語テキストを読み取ります。 ```csharp // Import the IronOcr namespace to use its classes. using IronOcr; // Create a new instance of the IronTesseract class. var Ocr = new IronTesseract(); // Set the OCR language to Arabic. Ocr.Language = OcrLanguage.Arabic; // Use a using statement to ensure that resources are disposed of correctly. using (var Input = new OcrInput(@"images\Arabic.png")) { // Perform OCR on the input image or document. var Result = Ocr.Read(Input); // Retrieve all recognized text from the document. var AllText = Result.Text; // Optionally, you can output the text to the console or use it otherwise. // Console.WriteLine(AllText); } ```