跳過到頁腳內容
OCR 工具

OCR Foto(初學者教學)

光學字元辨識(OCR)技術徹底改變了我們在數位世界中與文字互動的方式。 OCR 照片工具能夠將圖像轉換為文本,從而更容易將列印的筆記數位化。

在本文中,我們將探索四種線上 OCR 工具,包括免費和付費,最後介紹 IronOCR,展示如何在 C# 中程式化實施 OCR。

1. Google Vision API

Google Vision API提供強大的 OCR 解決方案,用於建立由 Google 提供的圖像轉文字轉換器。 它支援圖像和PDF文字提取,並能識別多種語言的文字。

OCR 照片(入門教學):圖 1

優點

  • 高精度
  • 語言支援
  • 與其他 Google Cloud 服務整合。

缺點

  • 需要 API 金鑰 *超過一定使用量後並非完全免費。

步驟 1:取得 API 金鑰

  • 存取Google Cloud 控制台
  • 建立新項目或選擇現有項目。
  • 啟用 Cloud Vision API 並產生 API 金鑰。

步驟 2:發出 API 請求

  • 使用 cURL 等工具或您選擇的程式語言發出 HTTP POST 請求。
  • 在請求負載中包含圖像檔案或 URL。
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
SHELL

步驟 3:解析結果

  • 從 API 回應中提取識別出的文字。
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseract是Google開發的開源 OCR 引擎。 它支援 100 多種語言,並因其準確性和靈活性而被廣泛使用。 它可以幫助轉換多種文件格式的圖像,甚至可以將掃描的圖像轉換為可編輯的文字。

OCR 照片(入門教學):圖 2

優點

  • 開源
  • 高精度
  • 社區支持

缺點

  • 可能需要額外的整合工具
  • 可能需要對影像進行預處理以獲得最佳效果。

步驟 1:安裝 Tesseract

  • 官方 GitHub 儲存庫下載並安裝 Tesseract OCR。
  • 將 Tesseract 資料夾新增至 PATH 環境變數中,以便從終端存取它。

步驟 2:對影像執行 OCR

打開終端並導航到包含圖像的資料夾。

  • 執行以下命令:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
SHELL

步驟 3:查看結果

  • 開啟產生的文字檔案( output.txt )以查看提取的文字。

3. ABBYY FineReader Online

ABBYY FineReader Online 是一款基於雲端的 OCR 服務,可讓使用者將掃描的文件和影像轉換為可編輯的格式。

這款線上工具提供了一個免費的基於 OCR 的線上文字轉換器,可以輕鬆地從圖像中提取文字。

OCR 照片(入門教學):圖 3

優點

  • 使用者友善的圖像OCR工具
  • 支援多種輸入格式
  • 保留文件格式

缺點

  • 免費使用次數有限
  • 需要網路連線

第一步:存取 ABBYY FineReader Online

  • 造訪ABBYY FineReader Online網站。
  • 下載適用於 Windows 或 Mac 的免費試用版。
  • 安裝軟體並按照給定的步驟操作。

步驟二:上傳圖片

  • 點擊"選擇檔案"按鈕並上傳您的圖片。

步驟 3:處理影像

  • 等待影像處理完成。 該工具將自動提取文字。

步驟 4:編輯文本

  • 儲存提取的文字或使用編輯器進行必要的更正。
  • 儲存為 Word、Excel 和文字格式。

4. 線上OCR

線上 OCR是一種基於網路的 OCR 服務,支援多種語言,可進行線上圖像轉文字轉換。 使用者可以直接從裝置上傳圖片,也可以提供圖片連結。

優點

  • 簡潔的使用者介面
  • 支援多種輸入格式
  • 免費使用,但有使用限制

缺點

  • 免費功能有限
  • 取決於網路連接

步驟 1:訪問線上 OCR

造訪線上OCR網站。

步驟二:上傳圖片

點擊"選擇檔案"按鈕並上傳您的圖片。

OCR 照片(入門教學):圖 4

步驟 3:選擇語言和輸出格式

選擇圖像中文字的語言和輸出格式。

OCR 照片(入門教學):圖 5

步驟 4:開始 OCR

點擊"轉換"按鈕開始OCR過程。

步驟五:下載文本

提取過程完成後,從提供的鏈接下載提取的文本。

OCR 照片(入門教學):圖 6

C# 中的 IronOCR 簡介

現在,讓我們深入了解 IronOCR,這是一個功能強大的 C# OCR 庫,它為開發人員提供了無縫實現 OCR 功能的工具。 IronOCR 是由 Iron Software 團隊開發的領先的 C# OCR 庫。

IronOCR是一款專為 C# 開發人員設計的強大的光學字元辨識 (OCR) 庫,它提供了一套強大的功能,可以從圖像中準確、無縫地提取文字。

IronOCR 以其可靠性和效率而聞名,在尋求從圖像和文件中提取文字的綜合解決方案的 C# 開發人員中廣受歡迎。

IronOCR 注重準確性和多功能性,已成為從文件管理系統到資料擷取應用程式等各種專案的首選。

IronOCR 利用先進的 OCR 演算法,能夠準確地從各種影像格式(包括 JPEG、PNG 和 TIFF)中解碼文字。 它具有多功能性,支援多種語言,使其成為滿足不同語言需求的應用程式的寶貴工具。

該程式庫與流行的 .NET 框架無縫集成,簡化了 C# 應用程式中 OCR 功能的實現。

無論您是處理掃描文件還是影像,IronOCR 的全面功能都能幫助開發人員輕鬆地將 OCR 功能整合到他們的專案中。

IronOCR功能詳解

1.進階 OCR 演算法: IronOCR 採用複雜的 OCR 演算法,超越了基本的字元識別,即使在複雜情況下也能確保高精度。 2.影像格式支援:開發人員可以利用 IronOCR 對各種影像格式(如 JPEG、PNG 和 TIFF)的支持,從而靈活地處理各種視覺內容。 3.多語言支援:考慮到應用程式的全球性,IronOCR 配備了多語言支持,能夠精確地提取不同語言的文本。

  1. PDF 文字擷取:除了影像之外,IronOCR 還擴展了其從 PDF 文件中提取文字的功能,增強了其在文件以數位格式儲存的場景中的適用性。 5.與 .NET 框架整合: IronOCR 與流行的 .NET 框架無縫集成,使 C# 開發人員能夠輕鬆地將 OCR 功能整合到他們的專案中,而無需進行大量的配置。

在 C# 中使用 IronOCR 實現 OCR

以下是一個使用 C# 中的 IronOCR從圖像中提取文字的簡單範例:

using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
Imports IronOcr ' Import the IronOcr namespace

' Create an instance of IronTesseract
Private ocr = New IronTesseract()

' Read text from the specified image file
Private imageText As String = ocr.Read("images\image.png").Text

' Output the extracted text
Console.WriteLine(imageText)
$vbLabelText   $csharpLabel

這段簡單的 C# 程式碼片段示範如何使用 IronOCR 從圖像檔案中讀取文字。開發人員可以根據具體需求進一步自訂 OCR 流程。

有關 IronOCR 高級功能的詳細信息,請訪問文件頁面。

結論

OCR影像辨識工具在將影像中的文字內容數位化方面發揮著至關重要的作用。 雖然各種線上工具提供了便利,但 IronOCR 為開發人員提供了一個強大且靈活的解決方案,可以將 OCR 功能整合到他們的 C# 應用程式中。

在線工具和程序化實現的庫之間的選擇取決於準確性要求、定制需求以及開發人員對 OCR 過程的控製程度等因素。

IronOCR確實提供免費試用,但這是必要的。 請從這裡下載軟體。

Kannaopat Udonpant
軟體工程師
在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。