跳過到頁腳內容

如何從影像文件中提取文本

透過觀看我們的教程,您可以在 C# 專案中發揮 IronOCR 的全部潛力,獲得逐步指南,設置和微調這個強大的庫,以便從圖片和 PDF 中準確有效地提取文字。

在本教程中,我們探索使用 IronOCR 從圖片中提取文字的過程,這是 C# 中一個強大的庫。 會話從在 Visual Studio 中設置 C# 控制台應用程式並通過 NuGet 套件管理器安裝 IronOCR 庫開始。

引入庫後,初始化一個 IronTesseract 對象,並對其配置選項進行微調以啟用條碼讀取並將語言設置為英文。 此設置允許通過多執行緒來準確識別文字並提高性能。 其他功能包括渲染 PDF 和將頁面分割模式設置為自動 OSD,自動分段並劃分單詞行。

教程進一步解釋如何使用配置變量進行行為微調,例如啟用並行化以平滑執行並識別表格佈局。 為了提高結果,將文字反轉功能禁用。 教程提供了更多配置選項的連結。

接下來,使用 OCR 輸入對象加載圖片文件,並使用 IronOCR 從圖片中提取文字。 識別出的文字輸出到控制台,展示了該庫的高精準度。

教程最後強調 IronOCR 是一個從圖片和 PDF 中提取文字的強大工具,鼓勵觀眾嘗試並提供試用連結。

相關視頻

準備好開始了嗎?
Nuget 下載 5,044,537 | 版本: 2025.11 剛剛發布