跳過到頁腳內容
OCR 工具

Windows 10 中的 OCR(免費線上工具)

光學字符識別(OCR)是將文字圖像轉換為機器可讀格式的過程。 當圖像或文檔被掃描到計算機中時,會以圖像文件的形式保存下來,這使得文本編輯器無法編輯、搜索或計算圖像文件中的單詞數量。OCR允許系統從圖像中提取文本,然後將內容存儲為可編輯的文本數據。

大多數商業流程都涉及使用印刷媒體來傳達信息。 掃描文件和圖像可能會帶來挑戰。 OCR技術通過將文本圖像轉換成文本數據來解決此問題,然後可由其他業務軟件進行分析。 這些數據可用於進行分析、精簡操作、流程自動化,提高生產率。

本文將介紹一些可幫助用戶高效管理文件的免費OCR程序。

class="hsg-featured-snippet">

如何在Windows 10中替代使用OCR

  1. 安裝用于Windows的軟件來執行OCR
  2. 使用OneNote中的從圖片複製文本功能從打開的文檔中提取文本
  3. 使用OnlineOCR軟件對圖像進行OCR
  4. 使用Windows中的NewOCR分析PDF或圖像中的文本
  5. 通過Convertio應用程序探索另一個免費的OCR替代方案

Microsoft OneNote:最佳免費OCR軟件

OneNote是一個數字筆記應用程序,它提供了一個單一的地方來保存所有筆記、研究、計劃和信息。 OneNote支持光學字符識別(OCR),它是一種工具,讓您從圖片或文件列印(PDF文檔或Word文件)中提取文本並粘貼到笔记中,这样您就可以修改文字。 這是一種很好的方法,例如從已掃描到OneNote的名片中複製信息。 提取文本後,您可以將其粘貼到OneNote或其他程序(如Outlook或Word)中的其他位置。 您可以從Microsoft Store下載最新版本,並且它通常已經安裝在Windows系統上。 它是文本識別中最好的一個免費OCR軟件選擇。

class="content-img-align-center"> OCR in Windows 10, Figure 1: OneNote OCR

class="content__image-caption">

從單個圖片中提取文本

  1. 右鍵單擊圖片,然後單擊從圖片複製文本
  2. 單擊要粘貼複製文本的位置,然後按Ctrl+V

從多頁文件列印圖片中提取文本

  1. 右鍵單擊任何圖像文件,然後執行以下操作之一:
    • 單擊從此列印的頁面複製文本以從當前選定的圖像(頁面)中複製文本。
    • 單擊從所有列印的頁面複製文本以從所有圖像(頁面)中複製文本。
  2. 單擊要粘貼複製文本的位置,然後按Ctrl+V

在線OCR工具

我們剛才看到了如何使用Microsoft OneNote在本地計算機上使用OCR技術從圖像文件中提取文本。接下來,我們來看看目前在線提供的OCR軟件。

OnlineOCR

OnlineOCR is a professional online OCR service with a clean and simple design. 該網站的外觀可能有些過時,因為它是在2009年創建的,但這也有助於簡化用戶的OCR操作。

OnlineOCR允許您識別掃描的PDF文檔、照片和數碼相機拍攝的圖像,並將其轉換為可編輯的文件,如Word、TXT和Excel。 可以識別46種不同的語言,包括英語、西班牙語、日語、中文和韓語。

class="content-img-align-center"> OCR in Windows 10, Figure 2: OnlineOCR

class="content__image-caption">

使用OnlineOCR完成OCR任務只需三個簡單步驟。

步驟1。 點擊“選擇文件”按鈕以上傳PDF文件或JPG、BMP、GIF或TIFF格式的掃描文件。 您還可以一次上傳多個文件。 注意:您可以上傳的最大文件大小為15 MB。

步驟2。 選擇您上傳文件的語言,然後從Word、Excel和TXT中選擇輸出格式。

步驟3。 點擊“轉換”開始識別和轉換您的文件。

NewOCR

Another free online OCR tool is NewOCR, which can analyze the text in an image file or PDF document that you upload, and then convert it to a text document that can be edited easily on your computer. 每個用戶都可以享受無限制的上傳且無需註冊。 您上傳的所有文件都將從服務器中刪除,因此無需擔心文件安全。

class="content-img-align-center"> OCR in Windows 10, Figure 3: NewOCR

class="content__image-caption">

首先,點擊"選擇文件"來添加設備中的圖像或掃描文檔,然後點擊"預覽"。

接下來,在語言框中選擇一種或多種識別語言,然後根據需要旋轉圖像。 如果上傳的文件包含多列文本,請勾選“頁面布局分析”選項卡,將文本拆分為多列。 最後,點擊"OCR"按鈕。

class="content-img-align-center"> OCR in Windows 10, Figure 4: NewOCR

class="content__image-caption">

識別的文本將顯示在下方的文本框中。 您可以下載TXT、Word或PDF格式的文本。

class="content-img-align-center"> OCR in Windows 10, Figure 5: NewOCR

class="content__image-caption">

Convertio

Convertio is a free online OCR service with a modern and attractive design. 免費未註冊用戶最多可處理10頁。 這些可以是PDF或Word文件。 您還可以使用掃描的PDF文件。如果需要識別更多頁面,只需註冊即可獲得改善的服務。

要在線上使用Convertio進行OCR,只需按照這三個步驟。

步驟1。 點擊"選擇文件"來選擇並上傳文件,來源可以為您的本地設備、Google Drive、Dropbox或網頁。 您還可以通過將文件直接拖到頁面上來添加文件。

class="content-img-align-center"> OCR in Windows 10, Figure 6: Convertio

class="content__image-caption">Convertio

步驟2。 選擇您上傳文件中使用的一種或兩種語言。然後將輸出格式設置為Word文檔、Excel工作簿、PDF文檔、文本文件或您所需的格式。您可以選擇識別所有頁面或僅識別某些頁,方法是在“頁碼”框中輸入頁碼範圍。

class="content-img-align-center"> OCR in Windows 10, Figure 7: Convertio OCR Settings

class="content__image-caption">Convertio OCR Settings

步驟3。 當識別和轉換完成後,將會出現一個下載已轉換文檔中提取文本的鏈接。只需將其保存到您的所需位置。

class="content-img-align-center"> OCR in Windows 10, Figure 8: Convertio Downloading Files

class="content__image-caption">Downloading Files from Convertio

作為OCR在線服務,Convertio提供的選擇最多,因此被認為是最佳免費在線OCR軟件。

IronOCR

IronOCR是.NET開發人員需要從掃描文檔或PDF文件中提取文本的流行OCR技術庫。 它提供了高精度、快速處理和在實時中的穩定性能,適用於成像、數字化和識別。 該庫是一個軟件組件,簡化了通過自動化文檔掃描來進行文檔數字化的過程。 它還支持其他流程,包括文檔索引和圖像處理。

IronOCR 在自動檢測和從不完美掃描的圖像和文檔中提取數據方面具有獨特的能力。 IronTesseract類提供了在任何平台上均增強速度和準確性的最先進的Tesseract版本。

讓我們來看看從掃描的圖像文件中提取文本的代碼示例。

// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
' Import the necessary IronOCR namespace
Imports IronOcr

' Create an instance of the IronTesseract class
Private Ocr = New IronTesseract()

Using Input = New OcrInput()
	' Load the image file to perform OCR
	Input.AddImage("test-files/redacted-employmentapp.png")

	' Perform OCR to extract text from the image(s)
	Dim Result = Ocr.Read(Input)

	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

輸入圖像以提取文本

class="content-img-align-center"> OCR in Windows 10, Figure 9: IronOCR, Redacted Employee Data

class="content__image-caption">Redacted Employee Data

提取文本輸出

輸出簡潔,僅通過少量代碼行就與原始圖像匹配,實現了完美的輸出,且無技術問題。

class="content-img-align-center"> OCR in Windows 10, Figure 10: IronOCR, Image Output

class="content__image-caption">Image Output

許可

IronOCR完全免費用於開發目的。 它也有一個針對商業許可證的不同定價結構。 Lite捆綁包從$799開始,無隱藏費用。 用戶可以在購買之前將IronOCR試用於生產中,使用免費試用。 選擇符合業務規模的許可證類型,包括單一開發者、十名開發者或無限制開發者的許可證。

Iron Software正在以大折扣提供其整個產品套件。 了解更多詳情,請訪問此頁面

Kannaopat Udonpant
軟體工程師
在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。