IronOCR 工具(Windows)

This article was translated from English: Does it need improvement?
Translated
View the article in English
標題橫幅螢幕

下載箭頭 立即下載 除了IronOCR API 函式庫, 還有一個可以下載的 Windows 桌面程式,稱為 IronOCR Utility。此應用程式可以用來:

  • 在購買前評估和測試 IronOCR 的功能
  • 視覺化 IronOCR 的檔案並找到正確的篩選器或裁剪區域
  • 找到讀取的最佳設定並將 C# 匯出到您的 IDE

Demo 安裝及設定

IronOCR 工具可以免費安裝,並可使用任何有效的試用、IronOCR 或 Suite 授權金鑰。如果您沒有授權,您可以獲取一個免費的全功能試用金鑰。 [這裡]() 無需信用卡或註冊帳戶。

  1. 安裝我們的 IronOCR 工具,請按照下載我們的 ZIP 在此

  2. 解壓縮 ZIP 檔案,然後運行 setup.exe

你應該會看到這個:

設定畫面

  1. 接下來,如果 IronOcrUtility.application 沒有自動運行,請手動運行它。

  2. 在此應用程式畫面中,將您的試用或完整授權金鑰輸入窗格。如果您沒有金鑰,可以獲取免費的全功能試用金鑰 這裡不需要信用卡或創建帳戶。輸入資訊,然後點擊APPLY KEY

初始化畫面

  1. 你現在會看到此預設視圖。開始使用時,請拖入圖片文件或 PDF 文件。或者點擊視圖面板中央的 瀏覽文件

基本畫面

一旦您使用這個工具評估了IronOCR,便是時候將IronOCR添加到您的函式庫或應用程序中。

安裝 IronOCR 函式庫

雖然 IronOCR 工具提供了一種可視化的交互方式來使用 IronOCR,但 IronOCR 套件提供了更多的功能和語言,並且有一個簡單易用的 API 來使用定制和優化的 Tesseract 5,即 Iron Tesseract。通過使用 IronOCR 和 IronTesseract 將 Tesseract 添加到您的專案中,您將能夠將任何包含文字的檔案或圖像以及掃描的文件轉換成文字和可搜索的 PDF。

示例用法和操作說明

設定標記類型

預設情況下,不會在檢視面板上添加標記。若要啟用此功能,請從 Highlight Settings 菜單中選擇一個設定。推薦使用的是 Word

強調選單螢幕

這將突出 IronOCR 能看到的所有詞語,您甚至可以將滑鼠懸停在詞語上來查看猜測的詞語和信心度。紅色突出顯示的深淺與其信心度相關:

突出文字螢幕

使用濾鏡來改進識別

許多圖像包含噪點、模糊和不對稱。我們必須濾除這些問題以進行正確的識別。如下面的圖像所示,文字現在是直的,必須進行傾斜校正以提高準確性和結果質量:

歪斜的圖片

導航到左側的篩選面板,我們可以排隊許多篩選器以實時查看它們的更新,以及取消排隊或設置它們的值:

篩選位置

在此應用校正傾斜濾鏡將會更新右側輸出面板中的程式碼,並使結果更加準確:

應用糾偏過濾器

匯出結果或新增至 .NET 專案

要在您的專案中獲得此結果,可以在代碼面板按下 COPY 按鈕匯出生成與輸出面板相同結果的代碼。只需將代碼貼到您的 IDE 中,並將檔案路徑替換成您的圖片檔案路徑即可。

保存代碼

對於掃描文件非常有用,如果您想要一個可以搜尋的 PDF,且文本覆蓋在原始圖像或 PDF 上,您可以使用 EXPORT AS PDF 按鈕導出它:

保存可搜索的 PDF