Tesseract 5 for .NET

在現代企業和國際商務中,數位文件已成為標準,擁有一個能夠識別和擷取多國語言的OCR引擎在文件操作成功中的地位舉足輕重。

Tesseract 5 是當前任何語言中最先進的庫。 然而,它也有一些警告:它並不容易實現,並且由於進入門檻較高,可以被認為難以使用。

然而,IronOCR 彌合了這一差距,讓開發人員,無論是初學者還是老手,都可以在一個簡單的庫中使用 Tesseract 5。 此外,IronOCR 是唯一已知的 Tesseract 5 OCR 的 .NET 程式庫,具有 .NET Framework、Standard、Core、Xamarin 和 Mono 的跨相容性。

您可以從此下載檔案專案連結.

這行代碼初始化了 IronTesseract 的實例,這是由 IronOCR 函式庫提供的類別。 新的物件 ocrTesseract 將執行光學字符識別(光學字符識別)在圖片上。

接下來,創建一個 OcrInput 物件 ocrInput,用於保存圖像以進行 OCR 處理。 using 關鍵字確保在不再需要時,自動釋放 ocrInput,從而節省資源。

此行將位於 "images\image.png" 的圖像文件加載到 ocrInput。 此圖像將成為 OCR 處理的目標。

在此執行 OCR 操作。 ocrTesseract 的 Read 方法處理 ocrInput 中已載入的影像,並返回一個包含識別文本的 OcrResult 對象,ocrResult。

最後,這行透過存取 ocrResult 的 Text 屬性,將提取的文字打印到控制台。 點擊這裡查看使用指南,包括範例、範例代碼和文件。