在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
光學字符識別(光學字符識別)是將文字圖像轉換為機器可讀格式的過程。 當圖片或文件被掃描進入電腦時,它會保存為圖片文件。這使得文字編輯器無法編輯、搜索或計算圖片文件中的字數。OCR允許系統從圖片中提取文字,然後將內容存儲為可編輯的文本數據。
大多數業務工作流程涉及使用印刷媒體傳遞資訊。 掃描文件和圖像可能會帶來挑戰。 OCR技術通過將文字圖像轉換為可以由其他商業軟體分析的文字數據來解決此問題。 這些數據可用於進行分析、精簡運營、流程自動化以及提高生產力。
本文將介紹一些免費的OCR程式,這些程式可以幫助用戶高效管理文件。
OneNote 是一款數位筆記應用程式,提供一個集中保存所有筆記、研究、計畫和資訊的地方。 OneNote 支援光學字符辨識(光學字符識別),一種可以從圖片或文件打印輸出中提取文本的工具(PDF 文件或 Word 文件)並將其貼到您的筆記中,這樣您就可以對詞語進行更改。 這是一種非常好的方法,可以從您已掃描到 OneNote 的名片中複製資訊。 提取文字後,您可以將其粘貼到 OneNote 或其他程式中,如 Outlook 或 Word。 您可以從 Microsoft Store 下載最新版本,而且它經常已經安裝在 Windows 系統上。 這是用於文本識別的最佳免費 OCR 軟體選擇之一。
右鍵點擊圖片,然後點擊 從圖片複製文字。
Ctrl+V
。右鍵點擊任意圖像檔案,然後執行以下操作之一:
點擊 從此頁打印件中複製文本 以僅從當前選擇的圖像中複製文本(頁面).
Ctrl+V
。我們剛剛看到了如何使用光學字符識別 (OCR) 技術在本地機器上利用 Microsoft OneNote 從圖像文件中提取文本。接下來,讓我們看看當前在線提供的 OCR 軟體。
線上OCR 是一個專業的在線OCR服務,具有簡潔清晰的設計。 由於這個網站是在2009年創建的,其外觀可能看起來有些過時,但這也有助於使OCR操作對使用者來說相當簡單。
OnlineOCR 允許您識別掃描的 PDF 文件、照片和數位相機拍攝的圖像,並將它們轉換為可編輯的文件,如 Word、TXT 和 Excel。 可以識別 46 種不同語言,包括英語、西班牙語、日語、中文和韓語。
使用 OnlineOCR 完成 OCR 任務只需三個簡單步驟。
步驟 1. 點擊「選擇檔案」按鈕上傳 PDF 文件或 JPG、BMP、GIF 或 TIFF 格式的掃描文檔。 您也可以一次上傳多個文件。 注意:您可以上傳的最大文件大小為 15 MB。
步驟 2. 選擇您上傳文件的語言,並從 Word、Excel 和 TXT 中選擇一種輸出格式。
步驟 3. 點選「轉換」以開始識別和轉換您的文件。
另一個免費的線上OCR工具是 新OCR可以分析您上傳的圖像文件或 PDF 文件中的文本,然後將其轉換為可以在您的電腦上輕鬆編輯的文本文件。 每位使用者都可以享有無限制的上傳,不需要任何註冊要求。 您上傳的所有檔案將會從伺服器中刪除,因此無需擔心檔案安全。
首先,點擊「選擇檔案」從您的裝置中添加圖片或掃描文件,然後點擊「預覽」。
接下來,在語言框中選擇一種或多種識別語言,然後根據需要旋轉圖片。 如果您上傳的文件包含多欄文字,請勾選「頁面佈局分析」選項卡,以將文字分成欄。 最後,點擊「OCR」按鈕。
辨識的文字將顯示在下面的文字框中。 您可以下載文字為 TXT、Word 或 PDF 格式。
Convertio 是一項現代且具有吸引力設計的免費線上光學字符識別服務。 免費、未註冊的用戶最多可以處理10頁。 這些可以是 PDF 或 Word 文件。 您也可以使用掃描的 PDF 文件。如果您需要辨識更多頁面,只需註冊以獲得更好的服務。
若要使用 Convertio 在線執行 OCR,只需遵循以下三個步驟。
步驟 1. 點擊“選擇檔案”以從您的本地裝置、Google Drive、Dropbox或網頁中選擇並上傳檔案。 您也可以通過將檔案拖到頁面上來添加它們。
步驟 2。 從您上傳的檔案中選擇一或兩種語言。接著,將輸出格式設置為 Word 文件、Excel 活頁簿、PDF 文件、文字檔或任何您需要的格式。您可以選擇識別所有頁面或僅識別某些頁面,方法是於「頁碼」框中輸入頁碼範圍。
步驟 3. 當識別和轉換完成後,已轉換文件中提取文本的下載連結會顯示在頂部。只需將其保存到您想要的位置即可。
Convertio 作為一個線上 OCR 服務提供了最多的選項,因此是最好的免費線上 OCR 軟件。
IronOCR是流行的OCR技術庫,適用於需要從掃描文檔或PDF文件中提取文字的.NET開發人員。 它在成像、數位化和識別的即時處理中提供高精確度、快速處理和穩固的性能。 該程式庫是一個軟體元件,通過自動化文件掃描來簡化文件的數位化。 它還支持其他流程,包括文件索引和圖像處理。
IronOCR 在自動檢測和提取不完美掃描的圖像和文件數據方面具有獨特的能力。 IronTesseract
類別提供了任何地方和任何平台上已知的最先進的 Tesseract 構建,具有更高的速度和準確性。
讓我們來看看從掃描的圖像文件中提取文本的代碼範例。
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/redacted-employmentapp.png")
//... you can add any number of images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/redacted-employmentapp.png")
//... you can add any number of images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
輸出乾淨並且只需幾行代碼就能匹配原始圖像,產生完美的輸出且無技術問題。
IronOCR 完全免費供開發使用。 它還有一個不同的定價結構,用於商業授權. Lite 套餐起價為 $749,無隱藏費用。 用戶可以在購買前使用免費試用版在生產環境中嘗試 IronOCR。 選擇一個符合您業務規模的套件,您可以選擇為一名開發人員、十名開發人員或無限名開發人員授權。