OCR 工具

Windows 10 的 OCR(免費線上工具)

發佈 2022年10月30日
分享:

光學字符識別 (光學字符識別) 是將文字圖像轉換為機器可讀格式的過程。當將圖像或文件掃描到計算機中時,會將其保存為圖像文件。這使得文字編輯器無法編輯、搜索或計算圖像文件中的單詞。OCR允許系統從圖像中提取文本,然後將內容存儲為可編輯的文本數據。

大多數業務工作流程都涉及使用印刷媒介傳遞信息。掃描文件和圖像可能會帶來挑戰。OCR 技術通過將文字圖像轉換為可由其他業務軟件分析的文本數據來解決這個問題。這些數據可用於進行分析、簡化操作、自動化流程並提高生產力。

本文將介紹一些免費的 OCR 程序,這些程序可以幫助用戶有效地管理文件。

Microsoft OneNote: 最佳免費OCR軟件

OneNote是一款數位筆記應用程式,提供單一位置來保存所有的筆記、研究、計劃和資訊。OneNote支援光學字符識別 (OCR) (光學字符識別),一種可以從圖片或文件打印輸出中提取文本的工具 (PDF 文件或 Word 文件) 並將其粘貼到您的筆記中,以便您可以更改單詞。這是一個很好的方法,可以像從您掃描到 OneNote 的名片中複製信息一樣。提取文本後,您可以將其粘貼到 OneNote 或其他程序(如 Outlook 或 Word)中的其他位置。您可以從 Microsoft 商店下載最新版本,該版本通常已安裝在 Windows 系統上。這是最佳的免費 OCR 文本識別軟件選項之一。

Windows 10 中的 OCR,圖1:OneNote OCR

從單張圖片提取文字

  1. 右鍵點擊圖片,然後點選 從圖片複製文字
  2. 點擊您想要粘貼複製文字的位置,然後按 Ctrl+V

從多頁文件打印出的圖像中提取文本

  1. 右鍵單擊任何圖像文件,然後執行以下操作之一:

    • 點擊 從本頁打印件複製文本 以僅從當前選定的圖像中複製文本 (頁面).

    • 點擊 從列印輸出的所有頁面複製文字 以從所有影像中複製文字 (頁面).
  2. 點擊您想要貼上複製文本的位置,然後按 Ctrl+V

在線OCR工具

我們剛剛看到如何使用Microsoft OneNote在本地機器上使用OCR技術從圖像文件中提取文字。接下來,讓我們看看當前在線可用的OCR軟件。

線上OCR

線上OCR 是一個專業的線上OCR服務,設計清晰簡單。由於該網站建立於2009年,因此看起來可能有點過時,但這也有助於保持OCR操作對用戶來說相當簡單。

線上OCR允許您識別掃描的PDF文件、照片和數碼相機拍攝的圖片,並將其轉換為可編輯的文件,如Word、TXT和Excel。它可以識別46種不同的語言,包括英語、西班牙語、日語、中文和韓語。

Windows 10 的 OCR,圖 2:OnlineOCR

使用 OnlineOCR 完成 OCR 工作只需三個簡單步驟。

步驟 1. 點擊「選擇文件」按鈕上傳 PDF 文件或 JPG、BMP、GIF、TIFF 格式的掃描文件。您還可以一次上傳多個文件。注意:可上傳的最大文件大小為 15 MB。

步驟 2. 選擇您上傳文件的語言,並從 Word、Excel 和 TXT 中選擇一種輸出格式。

步驟 3. 點擊「轉換」以開始識別和轉換您的文件。

新OCR

另一個免費的線上OCR工具是 新OCR,可以分析您上傳的圖像文件或 PDF 文件中的文字,然後將其轉換為可以在電腦上輕鬆編輯的文本文件。每個用戶都可以享受不限次數的上傳,且無需註冊要求。您上傳的所有文件都會從伺服器中刪除,因此不必擔心文件安全。

Windows 10 中的 OCR,圖 3:NewOCR

首先,点击「選擇檔案」从您的设备添加图片或扫描文档,然后点击「预览」。

接下来,在语言框中选择一种或多种识别语言,然后如有需要,旋转图片。如果您上传的文件包含多栏文字,请勾选「页面布局分析」选项卡将文字分成列。最后,点击「OCR」按钮。

在Windows 10上進行OCR,圖4:NewOCR

辨識後的文字將顯示在下面的文字框中。您可以下載 TXT、Word 或 PDF 格式的文本。

在 Windows 10 中的 OCR 圖 5:NewOCR

Convertio

Convertio 是一個免費的在線 OCR 服務,具有現代和吸引人的設計。免費且無需註冊的用戶最多可以處理 10 頁文件。這些文件可以是 PDF 或 Word 文件。您也可以使用掃描的 PDF 文件。如果您需要識別更多頁面,只需註冊即可獲得更佳的服務。

要使用 Convertio 在線進行 OCR,請按照以下三個步驟操作。

步驟 1. 點擊「選擇文件」來從您的本地設備、Google Drive、Dropbox 或網頁中選擇並上傳文件。您也可以通過將文件拖動到頁面上來添加文件。

Windows 10中的OCR,圖6:Convertio

Convertio

步驟2。選擇您上傳文件中使用的一或兩種語言。然後,將輸出格式設置為Word文件、Excel工作簿、PDF文件、文本文件或其他您需要的格式。您可以選擇識別所有頁面或僅識別特定頁面,方法是在“頁碼”框中輸入頁碼範圍。

OCR in Windows 10, Figure 7: Convertio OCR 設定

Convertio OCR 設定

步驟 3. 當識別和轉換完成後,已轉換文件中提取文本的下載連結會顯示在頂部。只需將其保存到您想要的位置即可。

Windows 10上的OCR,圖8:Convertio檔案下載

從 Convertio 下載文件

Convertio 作為一個線上 OCR 服務提供了最多的選項,因此是最好的免費線上 OCR 軟件。

IronOCR

IronOCR 是一個深受歡迎的OCR技術函式庫,適用於需要從掃描文件或PDF文件中提取文本的.NET開發人員。它提供高度精確、快速處理及在成像、數字化和識別方面具有強大性能的即時處理。該函式庫是一個軟體元件,通過自動化文件掃描簡化文件數字化過程。它同時支援其他流程,包括文件索引和影像處理。

IronOCR在自動檢測和提取從不完美掃描影像和文件中數據的能力上具有獨特優勢。IronTesseract 類別提供了在任何地方和任何平台上公認的最先進版本的Tesseract,具有更快的速度和更高的準確性。

讓我們來看看一個從掃描影像文件中提取文本的程式碼範例。

var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

將圖像輸入以提取文字

OCR in Windows 10, Figure 9: IronOCR, 員工資料 (已編修)

員工資料 (已編修)

抽取的文本輸出

輸出內容乾淨且與原始圖像匹配,只需幾行程式碼即可轉換為完美輸出,無任何技術問題。

OCR in Windows 10, Figure 10: IronOCR, 圖像輸出

圖像輸出

許可證

IronOCR 在開發用途中完全免費。它還有一個不同的定價結構,適用於 商業授權. Lite 授權包價格從 $749 起,無隱藏費用。用戶可以在購買前通過免費試用版在生產環境中試用 IronOCR。選擇符合您的業務規模的方案,可以選擇一名開發者、十名開發者或不限開發者的授權。

Iron Software 提供其整套產品 大幅折扣. 了解更多細節 此頁面

< 上一頁
最佳中文OCR(免費和線上工具)
下一個 >
企業 OCR 軟體比較

準備開始了嗎? 版本: 2024.10 剛剛發布

免費 NuGet 下載 總下載次數: 2,433,305 查看許可證 >