跳過到頁腳內容
OCR 工具

Windows 10 中的 OCR(免費線上工具)

光學字元辨識(OCR)是將影像文字轉換為機器可讀格式的過程。 當影像或文件掃描到電腦中時,它會被儲存為影像檔案。這使得文字編輯器無法編輯、搜尋或統計圖像檔案中的字數。 OCR(光學字元辨識)技術可讓系統從圖像中提取文本,並將提取的內容儲存為可編輯的文本資料。

大多數商業流程都涉及使用印刷媒體進行資訊交流。 掃描文件和影像可能會遇到一些挑戰。 OCR技術透過將文字影像轉換為文字資料來解決這個問題,然後其他商業軟體可以對這些文字資料進行分析。 這些數據可用於進行分析、簡化操作、自動化流程和提高生產力。

本文將介紹一些免費的OCR程序,這些程序可以幫助使用者有效率地管理文件。

微軟 OneNote:最佳免費 OCR 軟體

OneNote 是一款數位筆記應用程序,它提供了一個集中保存所有筆記、研究、計劃和資訊的地方。 OneNote 支援光學字元辨識(OCR),該工具可讓您從圖片或文件列印輸出(PDF 文件或 Word 文件)中提取文字並將其貼上到筆記中,以便您可以更改文字。 這是將掃描的名片資訊複製到 OneNote 等操作的絕佳方法。 提取文字後,您可以將其貼到 OneNote 中的其他位置,或貼上到其他程式(例如 Outlook 或 Word)中。 您可以從微軟商店下載最新版本,而且它通常已經安裝在 Windows 系統中。 它是目前最好的免費OCR文字辨識軟體之一。

OCR in Windows 10, Figure 1: OneNote OCR

從單張圖片中提取文本

  1. 右鍵單擊圖片,然後按一下"從圖片複製文字"
  2. 按一下要貼上複製文字的位置,然後按Ctrl+V

從多頁文件列印輸出的圖像中提取文本

  1. 右鍵單擊任意圖像文件,然後執行以下操作之一:
    • 按一下"從列印輸出的此頁面複製文字"僅從目前選定的圖像(頁面)複製文字。
    • 點擊"從列印輸出的所有頁面複製文字"以複製所有圖像(頁面)中的文字。
  2. 按一下要貼上複製文字的位置,然後按Ctrl+V

線上OCR工具

我們剛剛了解如何使用本機電腦上的 Microsoft OneNote,透過 OCR 技術從圖像檔案中提取文字。接下來,讓我們來看看目前有哪些線上 OCR 軟體可供使用。

線上OCR

OnlineOCR is a professional online OCR service with a clean and simple design. 由於網站創建於 2009 年,其外觀可能看起來有點過時,但這同時也使得 OCR 操作對用戶來說非常簡單。

OnlineOCR 可以識別掃描的 PDF 文件、照片和數位相機拍攝的影像,並將它們轉換為 Word、TXT 和 Excel 等可編輯檔案。 它可以識別 46 種不同的語言,包括英語、西班牙語、日語、中文和韓語。

OCR in Windows 10, Figure 2: OnlineOCR

使用 OnlineOCR 完成 OCR 工作只需三個簡單的步驟。

步驟 1.點選"選擇檔案"按鈕,上傳 PDF 檔案或 JPG、BMP、GIF 或 TIFF 格式的掃描文件。 您也可以一次上傳多個文件。 注意:您可上傳的最大檔案大小為 15 MB。

步驟 2.選擇上傳檔案的語言,並從 Word、Excel 和 TXT 中選擇輸出格式。

步驟 3.點選"轉換"開始辨識和轉換您的檔案。

新OCR

Another free online OCR tool is NewOCR, which can analyze the text in an image file or PDF document that you upload, and then convert it to a text document that can be edited easily on your computer. 所有用戶均可享有無限上傳,無需註冊。 您上傳的所有檔案將從伺服器中刪除,因此無需擔心檔案安全性問題。

OCR in Windows 10, Figure 3: NewOCR

首先,點擊"選擇文件"從您的裝置中新增圖像或掃描文檔,然後點擊"預覽"。

接下來,在語言框中選擇一種或多種識別語言,然後根據需要旋轉圖像。 如果您上傳的檔案包含多列文本,請勾選"頁面佈局分析"選項卡,將文字分割為多列。 最後,點選"OCR"按鈕。

OCR in Windows 10, Figure 4: NewOCR

識別出的文字將顯示在下面的文字方塊中。 您可以下載TXT、Word或PDF格式的文字。

OCR in Windows 10, Figure 5: NewOCR

轉換

Convertio is a free online OCR service with a modern and attractive design. 免費、未註冊用戶最多可處理 10 頁。 可以是PDF文件或Word文件。 您也可以使用掃描的PDF檔案。如果您需要識別更多頁面,只需註冊即可獲得更優質的服務。

要使用 Convertio 在線上執行 OCR,只需按照以下三個步驟操作即可。

步驟 1.點擊"選擇檔案",從本機裝置、Google 雲端硬碟、Dropbox 或網頁中選擇並上傳檔案。 您也可以將文件拖曳到頁面上來新增文件。

OCR in Windows 10, Figure 6: Convertio

Convertio

Step 2. 選擇上傳檔案中使用的一種或兩種語言。然後,將輸出格式設定為 Word 文件、Excel 工作簿、PDF 文件、文字檔案或您需要的任何其他格式。您可以透過在"頁碼"方塊中輸入頁碼範圍來選擇識別所有頁面或僅識別特定頁面。

OCR in Windows 10, Figure 7: Convertio OCR 設定

Convertio OCR 設定

步驟 3:識別和轉換完成後,頂部將顯示一個下載鏈接,用於下載已轉換文件中提取的文字。只需將其保存到您想要的位置即可。

OCR in Windows 10, Figure 8: Convertio Downloading Files

從 Convertio 下載文件

Convertio 作為線上 OCR 服務,提供了最多的選項,因此是最好的免費線上 OCR 軟體。

IronOCR。

IronOCR是一個流行的 OCR 技術庫,適用於需要從掃描文件或 PDF 文件中提取文字的 .NET 開發人員。 它為成像、數位化和識別提供高精度、快速處理和可靠的即時性能。 該庫是一個軟體元件,它透過自動掃描文件來簡化文件數位化過程。 它還支援其他流程,包括文件索引和影像處理。

IronOCR 的獨特之處在於它能夠自動偵測和提取掃描不完美的影像和文件中的資料。 IronTesseract等級提供了目前已知在任何平台和任何地方最先進的 Tesseract 構建,速度和精度都得到了提高。

讓我們來看一個從掃描圖像檔案中提取文字的程式碼範例。

// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
' Import the necessary IronOCR namespace
Imports IronOcr

' Create an instance of the IronTesseract class
Private Ocr = New IronTesseract()

Using Input = New OcrInput()
	' Load the image file to perform OCR
	Input.AddImage("test-files/redacted-employmentapp.png")

	' Perform OCR to extract text from the image(s)
	Dim Result = Ocr.Read(Input)

	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

輸入圖像以提取文字

OCR in Windows 10, Figure 9: IronOCR, 已編輯的員工數據

已編輯的員工數據

提取的文字輸出

只需幾行程式碼,即可輸出清晰且與原始影像完全匹配的影像,這意味著完美的輸出結果,且沒有任何技術問題。

OCR in Windows 10, Figure 10: IronOCR, 影像輸出

影像輸出

授權

IronOCR 完全免費,可用於開發目的。 它還針對商業許可製定了獨特的定價結構。 Lite 套餐起價為$799 ,無任何隱藏費用。 用戶可以透過免費試用版在生產環境中試用 IronOCR,然後再決定是否購買。 根據您企業的規模,選擇適合 1 位開發人員、10 位開發人員或無限開發人員的授權方案。

Iron Software 正在以大幅折扣出售其全套產品。 請造訪此頁面以了解更多詳情

Kannaopat Udonpant
軟體工程師
在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。