Tesseract 5 for .NET
在現代企業和國際商務中,數位文件已成為標準,擁有一個能夠識別和擷取多國語言的OCR引擎在文件操作成功中的地位舉足輕重。
Tesseract 5 是當前任何語言中最先進的庫。 然而,它也有一些警告:它並不容易實現,並且由於進入門檻較高,可以被認為難以使用。
然而,IronOCR 彌合了這一差距,讓開發人員,無論是初學者還是老手,都可以在一個簡單的庫中使用 Tesseract 5。 此外,IronOCR 是唯一已知的 Tesseract 5 OCR 的 .NET 程式庫,具有 .NET Framework、Standard、Core、Xamarin 和 Mono 的跨相容性。
您可以從此下載檔案專案連結.
使用 Tesseract 5 的五步驟程式碼
var ocrTesseract = new IronTesseract();
使用 var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\image.png");
var ocrResult = ocrTesseract.Read(ocrInput);
```csharp Console.WriteLine(ocrResult.Text); ```
這行代碼初始化了 IronTesseract 的實例,這是由 IronOCR 函式庫提供的類別。 新的物件 ocrTesseract 將執行光學字符識別(光學字符識別)在圖片上。
接下來,創建一個 OcrInput 物件 ocrInput,用於保存圖像以進行 OCR 處理。 using
關鍵字確保在不再需要時,自動釋放 ocrInput,從而節省資源。
此行將位於 "images\image.png" 的圖像文件加載到 ocrInput。 此圖像將成為 OCR 處理的目標。
在此執行 OCR 操作。 ocrTesseract 的 Read
方法處理 ocrInput 中已載入的影像,並返回一個包含識別文本的 OcrResult 對象,ocrResult。
最後,這行透過存取 ocrResult 的 Text 屬性,將提取的文字打印到控制台。 點擊這裡查看使用指南,包括範例、範例代碼和文件。