PDF OCR 文字擷取
Iron Tesseract 能夠讀取多種圖像格式,亦可處理 PDF 文件。 此功能無法透過傳統的免費 Tesseract 引擎實現。
OcrInput 提供自動修正 PDF 特性的選項,適用於掃描品質不佳的情況。
開發人員可指定讀取整份 PDF、選定頁面,或單一裁切區域。
如何在 C# 中對 PDF 檔案進行 OCR
- 下載 C# 函式庫以對 PDF 檔案進行 OCR 處理
- 請使用
AddPdf方法來新增 PDF 文件 - 使用
AddPdfPages方法 - 請使用
Read方法對新增的 PDF 執行 OCR - 檢視QR Code值
Barcodes屬性中。存取 Text 屬性以取得 OCR 結果
C# PDF OCR
許多 OCR 工具在最佳條件下運作良好,但若您需要一款能在任何條件下皆具備更高穩定性與精準度的解決方案,IronOCR 文字擷取方案正是您的最佳選擇。
專為文字擷取而打造的 IronOCR 從頭開始開發,具備將真實世界影像轉換為文字的能力,準確度高達 99%。
IronTesseract,我們的原生 C# OCR 函式庫,能夠以近乎人類的方式,從品質未必優良且有時會傾斜的真實世界影像中識別字元。
若掃描品質不佳,我們的 OCR 功能可自動修正 PDF 或圖像的特徵。
隨著我帶您深入了解目前市面上頂尖的 OCR 解決方案,您將能親眼見證其成效。
為何選擇 IronOCR 進行圖片或 PDF 文字擷取?
若考量 IronOCR 解決方案在 Tesseract 管理方面的獨特能力,選擇它無疑是明智之舉,其優勢包括:
- IronOCR 這款用於 PDF 文字擷取的 OCR 引擎,在純 .NET 環境中開箱即用
- 無需在您的電腦上安裝 Tesseract。
- 它與最新版本的引擎相容性極佳:Tesseract 5(以及 Tesseract 4 與 3)。
- 適用於任何 .NET 專案:.NET Framework 4.5 以上、.NET Standard 2 以上,以及 .NET Core 2、3 和 5!
- 相較於其他開源版 Tesseract,其準確度與速度均有所提升。
- IronOCR 支援 Xamarin、Mono、Azure 及 Docker 開發平台。
- 您可以透過 NuGet 套件管理複雜的 Tesseract 字典系統。
- 它能從 PDF、多幀 TIFF 以及所有主要圖像檔案中提取文字,無需任何額外操作。
- 它能修正品質低劣或傾斜的掃描影像,讓您的文字擷取專案獲得最佳成果。
您有品質不佳的掃描檔嗎? 沒問題!
在 OCR 任務方面,IronOCR 展現出更卓越的表現。 事實上,許多類似產品雖能與機器列印的高解析度完美文字或圖像良好配合,但在實際應用中卻會出現不準確或無法運作的情況。 然而,IronOCR 卻並非如此。
IronOCR 在修正品質不佳的文件方面表現出色。 它能校正傾斜的掃描圖像並增強低畫質照片,使其轉為可搜尋的 PDF 文件或圖像。 這正是我們產品與眾不同的關鍵所在。
調整 IronOCR 的效能以配合您的工作流程
透過 Iron Software 的 OCR 解決方案,您可以調整文字擷取任務的效能,以在工作流程中取得最佳平衡。 我們深知這對許多使用者和開發者至關重要,因此我們打造的 OCR 解決方案具備可調整的效能與高度靈活性。
例如,影響 OCR 任務速度的一個非常重要的因素,就是輸入影像的品質。 當背景雜訊較少且影像解析度較高(200 dpi 為理想範圍)時,OCR 結果的產出速度會更快,準確度也會更高。 然而,透過 IronOCR 的效能調校功能,即使是影像品質較差的任務也能迅速完成。
此外,選用數位雜訊較少的輸入圖像或掃描文字格式(例如 PNG 或 TIFF),其處理速度通常會比 JPEG 等低品質圖像格式更快。
安裝 IronOCR 解決方案輕而易舉
Iron Software 套件非常容易安裝和執行。 本工具適用於最主流的開發平台。 我們的解決方案具備跨平台支援,涵蓋 Windows、Linux、macOS、Azure、AWS 及 Docker —— 正因如此,C# 才成為開發者最青睞的 Tesseract OCR 引擎。
支援超過 125 種國際語言
針對 OCR 工作,當某款軟體支援多種語言時,其實用性便會大幅提升。 IronOCR 解決方案之所以不可或缺,在於它支援 125 種國際語言。 這些語言可透過以 DLL 檔案形式發佈的語言套件進行安裝。 您可從本網站或 Visual Studio 的 NuGet 套件管理員下載這些工具。
如何安裝 OCR 語言套件
支援一百二十種語言。 您可以透過以下兩種方式下載任何額外的 OCR 語言套件:
安裝 NuGet 套件
在 NuGet 中搜尋 IronOCR 語言。
使用 OCR 資料方法
請下載 ocrdata 檔案,並將其加入您的 .NET 專案或程式檔案中。
輕鬆將掃描檔案或圖片轉為可搜尋的文件
我們引以為傲的一項功能,是我們的 Tesseract 軟體能夠從輸入的圖片或掃描的 PDF 檔案中,建立可搜尋的 PDF 文件或可搜尋的文字。您可以在 C# 和 VB.NET 中,將 OCR 結果匯出為可搜尋的 PDF 文件。 這對於企業和政府機構在資料庫建置、搜尋引擎優化(SEO)以及 PDF 處理方面,確實能提供實質協助。
善用最佳 OCR 工具的強大功能
IronOCR 是從圖像和文件中擷取文字的頂尖工具。 它具備多項功能與解決方案,讓您在執行 OCR 任務時能享受輕鬆流暢的體驗。
我們的 OCR Tesseract C# 函式庫可協助您在 C# 和 .NET 應用程式等開發環境中,從圖片和掃描文件中擷取文字。
透過 IronOCR,您甚至能輕鬆開啟受密碼保護的 PDF 文件,並流暢地擷取其中的文字。
此外,該翻譯還具備以下特點:
- 無需可執行檔或 C# 程式碼
- 完整支援 PDF OCR
- 相容於 MVC、Web App、桌面、主控台及伺服器應用程式
- 完整支援 .NET Core、Standard 及 Framework
- 請使用
C#及VB閱讀 .NET - 讀取 QR 碼與 BARCODE
- 將 OCR 結果匯出為 XHTML 或可搜尋的 PDF 文件
- 支援多執行緒
- 可擷取圖片、座標、統計資料、字型等豐富內容
邁出大膽的一步,邁向 IronOCR
考量到這款卓越 OCR 解決方案的各項功能,若您決定嘗試 IronOCR,絕對不會錯。
只需點擊幾下,即可開始使用我們的軟體。 首先安裝 IronOCR —— 這是一項極其簡單的任務。 此外,我們針對各項工具的使用方式及操作指南,皆提供極具參考價值且詳盡的逐步教學;更別提我們資源豐富的支援中心,會盡快(幾乎是即時)回應您的查詢。
別再猶豫——立即選擇 IronOCR。 這是學習如何在 C# 中讀取 PDF 檔案的第一步,也是最重要的一步。
若您仍有任何疑慮,我們的免費試用授權金鑰正是您的最佳選擇。 這能協助您在無任何財務條件限制的情況下,充分探索 IronOCR 最新版本的全部潛力。 這有助於您決定哪種軟體授權最適合您。 如有任何疑問,無論您身在何處,請隨時聯繫我們的專家團隊。

