Persian OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR 是一個 C# 軟體元件,允許 .NET 編碼人員從圖像和 PDF 文件中讀取文字,語言包括波斯語等 126 種。

它是 Tesseract 的進階分叉,專為 .NET 開發人員打造,在速度和精確度上都經常超越其他 Tesseract 引擎。

IronOcr.Languages.Persian 的內容

下載[فارسی]。 * 下載方式為 Zip * 使用 NuGet 安裝

安裝

安裝 IronOCR.Languages.Persian 套件`。

程式碼範例

Install-Package IronOcr.Languages.Persian using IronOcr; class Program { static void Main() { // Create a new instance of IronTesseract var Ocr = new IronTesseract(); // Set the language to Persian Ocr.Language = OcrLanguage.Persian; // Load input image or PDF file using (var Input = new OcrInput(@"images\Persian.png")) { // Perform OCR to read text from the image var Result = Ocr.Read(Input); // Extract the recognized text var AllText = Result.Text; // Display the extracted text Console.WriteLine(AllText); } } } ``` 上述程式碼範例示範如何利用 IronOCR 函式庫在波斯文影像上執行 OCR。 必須安裝波斯語套件,並正確指定影像路徑。 OCR 作業會在 `using` 語句中執行,以確保資源的適當處理。