在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
光學字符識別 (光學字符識別) 是將文字圖像轉換為機器可讀格式的過程。當將圖像或文件掃描到計算機中時,會將其保存為圖像文件。這使得文字編輯器無法編輯、搜索或計算圖像文件中的單詞。OCR允許系統從圖像中提取文本,然後將內容存儲為可編輯的文本數據。
大多數業務工作流程都涉及使用印刷媒介傳遞信息。掃描文件和圖像可能會帶來挑戰。OCR 技術通過將文字圖像轉換為可由其他業務軟件分析的文本數據來解決這個問題。這些數據可用於進行分析、簡化操作、自動化流程並提高生產力。
本文將介紹一些免費的 OCR 程序,這些程序可以幫助用戶有效地管理文件。
OneNote是一款數位筆記應用程式,提供單一位置來保存所有的筆記、研究、計劃和資訊。OneNote支援光學字符識別 (OCR) (光學字符識別),一種可以從圖片或文件打印輸出中提取文本的工具 (PDF 文件或 Word 文件) 並將其粘貼到您的筆記中,以便您可以更改單詞。這是一個很好的方法,可以像從您掃描到 OneNote 的名片中複製信息一樣。提取文本後,您可以將其粘貼到 OneNote 或其他程序(如 Outlook 或 Word)中的其他位置。您可以從 Microsoft 商店下載最新版本,該版本通常已安裝在 Windows 系統上。這是最佳的免費 OCR 文本識別軟件選項之一。
Ctrl+V
。右鍵單擊任何圖像文件,然後執行以下操作之一:
點擊 從本頁打印件複製文本 以僅從當前選定的圖像中複製文本 (頁面).
Ctrl+V
。我們剛剛看到如何使用Microsoft OneNote在本地機器上使用OCR技術從圖像文件中提取文字。接下來,讓我們看看當前在線可用的OCR軟件。
線上OCR 是一個專業的線上OCR服務,設計清晰簡單。由於該網站建立於2009年,因此看起來可能有點過時,但這也有助於保持OCR操作對用戶來說相當簡單。
線上OCR允許您識別掃描的PDF文件、照片和數碼相機拍攝的圖片,並將其轉換為可編輯的文件,如Word、TXT和Excel。它可以識別46種不同的語言,包括英語、西班牙語、日語、中文和韓語。
使用 OnlineOCR 完成 OCR 工作只需三個簡單步驟。
步驟 1. 點擊「選擇文件」按鈕上傳 PDF 文件或 JPG、BMP、GIF、TIFF 格式的掃描文件。您還可以一次上傳多個文件。注意:可上傳的最大文件大小為 15 MB。
步驟 2. 選擇您上傳文件的語言,並從 Word、Excel 和 TXT 中選擇一種輸出格式。
步驟 3. 點擊「轉換」以開始識別和轉換您的文件。
另一個免費的線上OCR工具是 新OCR,可以分析您上傳的圖像文件或 PDF 文件中的文字,然後將其轉換為可以在電腦上輕鬆編輯的文本文件。每個用戶都可以享受不限次數的上傳,且無需註冊要求。您上傳的所有文件都會從伺服器中刪除,因此不必擔心文件安全。
首先,点击「選擇檔案」从您的设备添加图片或扫描文档,然后点击「预览」。
接下来,在语言框中选择一种或多种识别语言,然后如有需要,旋转图片。如果您上传的文件包含多栏文字,请勾选「页面布局分析」选项卡将文字分成列。最后,点击「OCR」按钮。
辨識後的文字將顯示在下面的文字框中。您可以下載 TXT、Word 或 PDF 格式的文本。
Convertio 是一個免費的在線 OCR 服務,具有現代和吸引人的設計。免費且無需註冊的用戶最多可以處理 10 頁文件。這些文件可以是 PDF 或 Word 文件。您也可以使用掃描的 PDF 文件。如果您需要識別更多頁面,只需註冊即可獲得更佳的服務。
要使用 Convertio 在線進行 OCR,請按照以下三個步驟操作。
步驟 1. 點擊「選擇文件」來從您的本地設備、Google Drive、Dropbox 或網頁中選擇並上傳文件。您也可以通過將文件拖動到頁面上來添加文件。
步驟2。選擇您上傳文件中使用的一或兩種語言。然後,將輸出格式設置為Word文件、Excel工作簿、PDF文件、文本文件或其他您需要的格式。您可以選擇識別所有頁面或僅識別特定頁面,方法是在“頁碼”框中輸入頁碼範圍。
步驟 3. 當識別和轉換完成後,已轉換文件中提取文本的下載連結會顯示在頂部。只需將其保存到您想要的位置即可。
Convertio 作為一個線上 OCR 服務提供了最多的選項,因此是最好的免費線上 OCR 軟件。
IronOCR 是一個深受歡迎的OCR技術函式庫,適用於需要從掃描文件或PDF文件中提取文本的.NET開發人員。它提供高度精確、快速處理及在成像、數字化和識別方面具有強大性能的即時處理。該函式庫是一個軟體元件,通過自動化文件掃描簡化文件數字化過程。它同時支援其他流程,包括文件索引和影像處理。
IronOCR在自動檢測和提取從不完美掃描影像和文件中數據的能力上具有獨特優勢。IronTesseract
類別提供了在任何地方和任何平台上公認的最先進版本的Tesseract,具有更快的速度和更高的準確性。
讓我們來看看一個從掃描影像文件中提取文本的程式碼範例。
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/redacted-employmentapp.png")
//... you can add any number of images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/redacted-employmentapp.png")
//... you can add any number of images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
輸出內容乾淨且與原始圖像匹配,只需幾行程式碼即可轉換為完美輸出,無任何技術問題。
IronOCR 在開發用途中完全免費。它還有一個不同的定價結構,適用於 商業授權. Lite 授權包價格從 $749 起,無隱藏費用。用戶可以在購買前通過免費試用版在生產環境中試用 IronOCR。選擇符合您的業務規模的方案,可以選擇一名開發者、十名開發者或不限開發者的授權。