Yoruba OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR 是一個 C# 軟體元件,可讓 .NET 開發人員從圖片和 PDF 文件中讀取文字,語言包括約魯巴語等 126 種。 它是 Tesseract 的進階分叉,專為 .NET 開發人員打造,在速度和精確度上都經常超越其他 Tesseract 引擎。

IronOcr.Languages.Yoruba的內容

本套件包含 43 種 .NET 的 OCR 語言:

  • 約魯巴語
  • YorubaBest
  • YorubaFast

下載

[Yorùbá]。 * 以 Zip 方式下載 * 使用 NuGet 安裝

安裝

程式碼範例 Install-Package IronOcr.Languages.Yoruba using IronOcr; class Program { static void Main() { // Create a new instance of the IronTesseract OCR engine var Ocr = new IronTesseract(); // Set the OCR language to Yoruba Ocr.Language = OcrLanguage.Yoruba; // Specify the image or PDF file to read using (var Input = new OcrInput(@"images\Yoruba.png")) { // Perform OCR on the input file var Result = Ocr.Read(Input); // Extract all recognized text var AllText = Result.Text; // Output the recognized text Console.WriteLine("Recognized Text: "); Console.WriteLine(AllText); } } } ``` 程式碼內的注解會說明每個步驟,從設定語言到擷取與列印辨識的文字。 本範例著重於使用 IronOCR 讀取約魯巴語文字,方法是指定約魯巴語,並處理影像或 PDF 檔案。