OCR 工具

Windows 10 的 OCR(免費線上工具)

喬迪·巴迪亞
喬迪·巴迪亞
2022年10月30日
分享:

光學字符識別(OCR)是將文本圖像轉換為機器可讀格式的過程。 當圖片或文件被掃描進入電腦時,它會保存為圖片文件。這使得文字編輯器無法編輯、搜索或計算圖片文件中的字數。OCR允許系統從圖片中提取文字,然後將內容存儲為可編輯的文本數據。

大多數業務工作流程涉及使用印刷媒體傳遞資訊。 掃描文件和圖像可能會帶來挑戰。 OCR技術通過將文字圖像轉換為可以由其他商業軟體分析的文字數據來解決此問題。 這些數據可用於進行分析、精簡運營、流程自動化以及提高生產力。

本文將介紹一些免費的OCR程式,這些程式可以幫助用戶高效管理文件。

Microsoft OneNote:最佳免費OCR軟體

OneNote 是一款數位筆記應用程式,提供一個集中保存所有筆記、研究、計畫和資訊的地方。 OneNote 支援光學文字辨識(OCR),這是一種工具,讓您可以從圖片或檔案列印輸出(PDF 文件或 Word 檔案)中提取文字並將其貼到筆記中,以便您可以對文字進行更改。 這是一種非常好的方法,可以從您已掃描到 OneNote 的名片中複製資訊。 提取文字後,您可以將其粘貼到 OneNote 或其他程式中,如 Outlook 或 Word。 您可以從 Microsoft Store 下載最新版本,而且它經常已經安裝在 Windows 系統上。 這是用於文本識別的最佳免費 OCR 軟體選擇之一。

Windows 10 中的 OCR,圖1:OneNote OCR

從單張圖片中提取文本

  1. 右鍵點擊圖片,然後點擊從圖片複製文字

  2. 點擊您想要粘貼已複製文字的位置,然後按下Ctrl+V

從多頁文件列印的影像中提取文本

  1. 右鍵點擊任意圖像檔案,然後執行以下操作之一:

    • 點選從列印頁複製文字以僅從目前選定的影像(頁面)複製文字。

    • 點擊從列印稿的所有頁面複製文字以從所有圖像(頁面)中複製文字。
  2. 點擊您想要粘貼已複製文字的位置,然後按下Ctrl+V

在線OCR工具

我們剛剛看到了如何使用光學字符識別 (OCR) 技術在本地機器上利用 Microsoft OneNote 從圖像文件中提取文本。接下來,讓我們看看當前在線提供的 OCR 軟體。

線上OCR

[OnlineOCR](https://www.onlineocr.net/" target="_blank" rel="nofollow noopener noreferrer) 是一項專業的線上 OCR 服務,其設計簡潔且易於使用。 由於這個網站是在2009年創建的,其外觀可能看起來有些過時,但這也有助於使OCR操作對使用者來說相當簡單。

OnlineOCR 允許您識別掃描的 PDF 文件、照片和數位相機拍攝的圖像,並將它們轉換為可編輯的文件,如 Word、TXT 和 Excel。 可以識別 46 種不同語言,包括英語、西班牙語、日語、中文和韓語。

Windows 10 的 OCR,圖 2:OnlineOCR

使用 OnlineOCR 完成 OCR 任務只需三個簡單步驟。

步驟 1. 點擊「選擇文件」按鈕以上傳 PDF 文件或 JPG、BMP、GIF 或 TIFF 格式的掃描文件。 您也可以一次上傳多個文件。 注意:您可以上傳的最大文件大小為 15 MB。

步驟 2。 選擇您上傳檔案的語言,然後從 Word、Excel 和 TXT 中選擇一個輸出格式。

步驟3。 點擊「轉換」以開始識別並轉換您的文件。

新OCR

另一個免費的在線 OCR 工具是[](https://www.newocr.com/" target="_blank" rel="nofollow noopener noreferrer)NewOCR,它可以分析您上傳的圖像文件或 PDF 文檔中的文本,然後將其轉換為可以在您的計算機上輕鬆編輯的文本文檔。 每位使用者都可以享有無限制的上傳,不需要任何註冊要求。 您上傳的所有檔案將會從伺服器中刪除,因此無需擔心檔案安全。

Windows 10 中的 OCR,圖 3:NewOCR

首先,點擊「選擇檔案」從您的裝置中添加圖片或掃描文件,然後點擊「預覽」。

接下來,在語言框中選擇一種或多種識別語言,然後根據需要旋轉圖片。 如果您上傳的文件包含多欄文字,請勾選「頁面佈局分析」選項卡,以將文字分成欄。 最後,點擊「OCR」按鈕。

在Windows 10上進行OCR,圖4:NewOCR

辨識的文字將顯示在下面的文字框中。 您可以下載文字為 TXT、Word 或 PDF 格式。

在 Windows 10 中的 OCR 圖 5:NewOCR

Convertio

[Convertio](https://convertio.co/ocr/" target="_blank" rel="nofollow noopener noreferrer) 是一個設計現代且吸引人的免費在線OCR服務。 免費、未註冊的用戶最多可以處理10頁。 這些可以是 PDF 或 Word 文件。 您也可以使用掃描的 PDF 文件。如果您需要辨識更多頁面,只需註冊以獲得更好的服務。

若要使用 Convertio 在線執行 OCR,只需遵循以下三個步驟。

步驟 1. 按一下「選擇檔案」以從您的本地設備、Google Drive、Dropbox 或網頁中選擇並上傳檔案。 您也可以通過將檔案拖到頁面上來添加它們。

Windows 10中的OCR,圖6:Convertio

Convertio

步驟 2。 從您上傳的檔案中選擇一或兩種語言。接著,將輸出格式設置為 Word 文件、Excel 活頁簿、PDF 文件、文字檔或任何您需要的格式。您可以選擇識別所有頁面或僅識別某些頁面,方法是於「頁碼」框中輸入頁碼範圍。

Windows 10 的 OCR,圖7:Convertio OCR 設定

Convertio OCR 設定

步驟 3. 當識別和轉換完成後,轉換後文件中的提取文本下載連結將出現在頂部。只需將其保存到您所需的位置。

Windows 10上的OCR,圖8:Convertio檔案下載

從 Convertio 下載文件

Convertio 作為一個線上 OCR 服務提供了最多的選項,因此是最好的免費線上 OCR 軟件。

IronOCR

IronOCR 是一個受歡迎的 OCR 技術庫,專為 .NET 開發者設計,需從掃描文件或 PDF 檔案中提取文本。 它在成像、數位化和識別的即時處理中提供高精確度、快速處理和穩固的性能。 該程式庫是一個軟體元件,通過自動化文件掃描來簡化文件的數位化。 它還支持其他流程,包括文件索引和圖像處理。

IronOCR 在自動檢測和提取不完美掃描的圖像和文件數據方面具有獨特的能力。 IronTesseract 類提供了目前在任何地方和任何平台上最先進的 Tesseract,具有更高的速度和準確性。

讓我們來看看從掃描的圖像文件中提取文本的代碼範例。

var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

將圖像輸入以提取文字

在 Windows 10 中的 OCR,圖 9:IronOCR,員工數據審核

員工資料 (已編修)

提取的文本輸出

輸出乾淨並且只需幾行代碼就能匹配原始圖像,產生完美的輸出且無技術問題。

在 Windows 10 中的 OCR,圖 10:IronOCR,影像輸出

圖像輸出

授權

IronOCR 完全免費供開發使用。 它也有針對商業許可證的獨特定價結構。 Lite 套裝方案起價為 $749,無隱藏費用。 用戶可以在購買前使用免費試用版在生產環境中嘗試 IronOCR。 選擇一個符合您業務規模的套件,您可以選擇為一名開發人員、十名開發人員或無限名開發人員授權。

Iron Software 正以大折扣提供其整套產品。 在此頁面了解更多詳細資訊

喬迪·巴迪亞
軟體工程師
Jordi 最擅長 Python、C# 和 C++,當他不在 Iron Software 發揮技能時,他會進行遊戲編程。他負責產品測試、產品開發和研究,為持續產品改進增添了巨大的價值。多樣化的經驗使他感到挑戰和投入,他說這是與 Iron Software 合作的最喜歡的方面之一。Jordi 在佛羅里達州邁阿密長大,並在佛羅里達大學學習計算機科學和統計學。
< 上一頁
最佳中文OCR(免費和線上工具)
下一個 >
企業 OCR 軟體比較