Tesseract 5 for .NET

在現代企業和國際商務中,數位文件已成為標準,擁有一個能夠識別和擷取多國語言的OCR引擎在文件操作成功中的地位舉足輕重。

Tesseract 5 是當前任何語言中最先進的庫。 然而,它也有一些警告:它並不容易實現,並且由於進入門檻較高,可以被認為難以使用。

然而,IronOCR 彌合了這一差距,讓開發人員,無論是初學者還是老手,都可以在一個簡單的庫中使用 Tesseract 5。 此外,IronOCR 是唯一已知的 Tesseract 5 OCR 的 .NET 程式庫,具有 .NET Framework、Standard、Core、Xamarin 和 Mono 的跨相容性。

您可以從此連結下載一個文件專案。

這行初始化了IronTesseract的實例,這是由IronOCR庫提供的一個類別。 新的物件 ocrTesseract 將對影像執行光學字元辨識(OCR)。

接下來,創建了一個OcrInput對象,ocrInput,用於保存圖像或多個圖像以進行OCR處理。 using 關鍵字確保在不再需要時,自動釋放 ocrInput,從而節省資源。

此行將位於 "images\image.png" 的圖像文件加載到 ocrInput。 此圖像將成為 OCR 處理的目標。

在此執行 OCR 操作。 ocrTesseract 的Read方法處理加載在 ocrInput 中的圖像,並返回一個OcrResult物件 ocrResult,其中包含已識別的文字。

最後,這行透過存取 ocrResult 的 Text 屬性,將提取的文字打印到控制台。 點擊這裡查看使用指南,包括範例、範例代碼和文件。