跳過到頁腳內容
OCR 工具

線上 OCR 轉換器——免費線上工具

OCR是光學字元辨識的縮寫。 它是電腦將包含文字的圖像轉換為機器可讀文字的過程。 該過程是透過將掃描圖像轉換為可在文字處理器上編輯的文字來完成的。 過去,OCR 僅用於將紙本文件和圖像轉換為數位格式,但現在它已廣泛應用於許多互動式環境中。 OCR 軟體被Google等公司廣泛用於將書籍和報紙數位化,使其可搜尋並建立索引,以便在世界各地的圖書館中展示。 過去十年,隨著數據和分析技術的結合,OCR 的應用範圍不斷擴大。 各組織越來越多地使用這項技術來整合來自不同來源的數據,為其添加時間戳,並創建元數據。 這有助於組織根據準確的指標做出決策。 OCR技術在各行各業的應用越來越廣泛。 它可以更快地完成自動掃描、資料提取和轉錄服務等任務。 要使用 OCR,必須使用字元辨識軟體將圖像轉換為文本,從而勾勒出單字的輪廓。 著名的Google翻譯軟體是基於OCR技術的。

在本文中,我們將評測三款免費的線上 OCR 工具,以及 IronOCR .NET 庫。

免費線上OCR工具

本節介紹免費線上OCR工具。 線上 OCR 工具可以幫助我們將紙本文件轉換為數位文字。 市面上有許多OCR工具可供選擇。 這些工具能夠將掃描圖像精確轉換為可編輯文字。 有些服務允許您付費上傳掃描文件,然後再返回所需的文字;而有些則是免費的線上 OCR 工具,可以完全免費使用。 我們來看三款免費的線上OCR工具。

OnlineOCR

OnlineOCR 是一家線上掃描服務供應商,能夠快速且準確地將紙本文件轉換為數位格式。 它提供了一種將紙本文件快速轉換為數位文件的方法。 OnlineOCR 利用先進技術,在幾秒鐘內將任何紙本文件數位化,為全球組織提供文件轉換服務。 所有掃描均由經過最高水準培訓的員工進行,以提供高品質的轉換服務。 讓我們看看如何使用這個線上工具進行OCR識別:

  • 開啟OnlineOCR網站。
  • 點選"選擇檔案"按鈕,然後選擇要上傳的檔案。 您可以選擇任何影像檔案或列印文件。
  • 在步驟 2 中,您可以選擇 OCR 語言和輸出類型。 您可以選擇 .docx、.xsls 和純文字格式作為輸出結果。
  • 之後,點選"轉換"按鈕。 它將開始對指定檔案進行OCR識別。您可以選擇影像檔案或任何掃描文件。 輸出結果將顯示在文字方塊中。 您也可以下載 Microsoft Word 文件格式的輸出檔。

輸入影像:

Online Ocr Converter 1 related to 輸入影像:

輸出:

Online Ocr Converter 2 related to 輸出:

OCR.Space

OCR.Space 是一款免費的網頁應用程序,任何人都可以上傳紙本文件並將其轉換為可編輯的文字。 它對學生、翻譯人員、研究人員和記者都很有用。 這款線上 OCR 工具旨在為中小企業提供簡單的解決方案,將紙本文件數位化,從而節省伺服器空間。 讓我們來看看如何使用這個網站進行OCR識別。

  • 在瀏覽器中開啟OCR.Space網站。 點選"選擇檔案"按鈕,然後選擇檔案。它可以是PDF文件,也可以是任何你想轉換成文字的圖像檔案。 您也可以使用任何圖像或 PDF 文件的 URL 進行線上 OCR 識別。
  • 您必須為 OCR 任務選擇一種語言。 您可以從下拉式選單中選擇。
  • 如果影像檔案位置不正確,OCR.Space 提供自動旋轉影像選項。
  • 如果上傳的 PDF 文件中有任何發票或表格,則必須選擇"表格識別"選項。
  • 從"建立可搜尋 PDF"中選擇一個選項。 之後,選擇任意 OCR 引擎進行線上 OCR 識別。
  • 之後,點選"開始 OCR"按鈕。 這將開始對上傳的文件進行文字識別,並將輸出文字顯示在輸出文字方塊中。
Online Ocr Converter 3 related to OCR.Space

OCR2Edit

OCR2Edit 是一款線上 OCR 工具,可將掃描的 PDF、影像和螢幕截圖轉換為可編輯的文字檔案。 與傳統的OCR工具不同,它無需安裝。 您可以上傳要轉換的文檔,然後指定要轉換成的語言。 OCR2Edit 是一款優秀的線上工具,可協助您輕鬆地將掃描文件轉換為可編輯文件。 您可以上傳任何文件並將其轉換為您選擇的語言,而無需在您的裝置上安裝任何軟體或在您的電腦上下載任何軟體。 OCR2Edit 提供六種類型的 OCR 工具。

Online Ocr Converter 4 related to OCR2Edit

您可以將圖像文件轉換為文本、轉換為 Word 文件、將 PDF 文件轉換為文本,以及執行許多其他任務。 本文將探討"圖像轉文本"工具。 讓我們來看看具體該怎麼做:

  • 前往 OCR2Edit 網站上的"圖像轉文字"工具。
  • 點選"選擇檔案"按鈕,上傳要進行 OCR 的檔案。
Online Ocr Converter 5 related to OCR2Edit
  • 之後,點選"開始"按鈕。 它會提取文本,並在下一頁的文本文件中輸出結果。 輸出文件將自動下載。
Online Ocr Converter 6 related to OCR2Edit

IronOCR:C# OCR庫

IronOCR 庫是一個高效能、易於使用且易於安裝的 OCR 庫,它為開發人員提供了一套強大的工具來執行光學字元辨識 (OCR) 任務。 該庫本質上是一組用 C# 創建的 OCR 演算法,並提供 API 供開發人員輕鬆整合到他們的專案中。 它使開發人員能夠在各種環境中執行準確的 OCR,例如紙本文件或掃描影像。 開發者可以使用該庫創建光學字元辨識軟體。 它的 API 使其與大多數語言和許多流行的框架相容。 它還擁有完善的測試套件,提供詳細的測試覆蓋率。 該程式庫支援以下文件格式:GIF、JPEG、PNG、TIFF、BMP 和 PDF。

IronOCR 庫支援多語言字元集以及單一語言(英文)。 該庫支援識別雙色調或灰階文件、灰階影像、帶拜耳圖案或不含拜耳圖案的彩色影像、帶有 CMYK 或不帶 CMYK 的彩色影像以及灰階資訊或不含灰階資訊的灰階影像。 IronOCR庫非常適合文件辨識、文字處理和影像處理。 讓我們來看一個在 C# 專案中使用 IronOCR 庫的程式碼範例:

using IronOcr;

// Create an instance of the IronTesseract class.
var Ocr = new IronTesseract();

// Using a `using` statement to handle disposable resources.
using (var Input = new OcrInput())
{
    // Add a sample image to the OcrInput instance.
    Input.AddImage("images/sample.jpeg");

    // Perform OCR on the added images and store the result.
    var Result = Ocr.Read(Input);

    // Print the recognized text to the console.
    Console.WriteLine(Result.Text);
}
using IronOcr;

// Create an instance of the IronTesseract class.
var Ocr = new IronTesseract();

// Using a `using` statement to handle disposable resources.
using (var Input = new OcrInput())
{
    // Add a sample image to the OcrInput instance.
    Input.AddImage("images/sample.jpeg");

    // Perform OCR on the added images and store the result.
    var Result = Ocr.Read(Input);

    // Print the recognized text to the console.
    Console.WriteLine(Result.Text);
}
Imports IronOcr

' Create an instance of the IronTesseract class.
Private Ocr = New IronTesseract()

' Using a `using` statement to handle disposable resources.
Using Input = New OcrInput()
	' Add a sample image to the OcrInput instance.
	Input.AddImage("images/sample.jpeg")

	' Perform OCR on the added images and store the result.
	Dim Result = Ocr.Read(Input)

	' Print the recognized text to the console.
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

摘要

在執行這些特定任務方面,IronOCR 處於領先地位。 它對所有支援的語言都表現出色。 使用本產品無需連接網路或安裝外部軟體。 只需幾行程式碼,您自己的 OCR 軟體即可投入使用。

IronOCR 在開發階段是免費的,但在生產環境中使用則需要付費。 不過,您可以先試用 IronOCR 庫的免費試用版,用於生產環境。 目前,您只需支付兩款產品的價格,即可購買 Iron Software 的全部五款產品。 更多詳情請點擊此連結

Kannaopat Udonpant
軟體工程師
在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。