跳過到頁腳內容
OCR 工具

OCR Foto(初學者教學)

光學字符識別(OCR)技術已經徹底改變了我們在數字世界中與文字互動的方式。 OCR照片工具使得將圖片轉換為文字變得更簡單,從而更容易將打印的筆記數字化。

在本文中,我們將探索四個在線OCR工具——包括免費和付費——並以IronOCR的介紹作結,展示如何在C#中以程式化的方式應用OCR。

1. Google視覺API

Google視覺API提供了一個由Google提供的強大OCR解決方案,用於創建圖片到文字的轉換器。 它支持圖像和PDF文本提取,並能識別多種語言的文本。

OCR照片(初學者教程):圖1

優勢

  • 高精度
  • 語言支持
  • 與其他Google雲端服務的整合。

劣勢

  • 需要API密鑰
  • 超過一定使用限額將不完全免費。

步驟1:獲取API密鑰

  • 訪問Google Cloud Console
  • 創建新項目或選擇現有項目。
  • 啟用雲端視覺API並生成API密鑰。

步驟2:發送API請求

  • 使用cURL或您選擇的程式語言進行HTTP POST請求。
  • 在請求有效載荷中包含圖像文件或網址。
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
SHELL

步驟3:解析結果

  • 從API響應中提取識別的文本。
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseract是由Google開發的開源OCR引擎。 它支持100多種語言,因其精準性和靈活性而被廣泛使用。 它幫助將多種文件格式的圖像轉換,甚至將掃描圖像轉換為可編輯文字。

OCR照片(初學者教程):圖2

優勢

  • 開源
  • 高精度
  • 社區支持

劣勢

  • 可能需要額外的工具進行整合
  • 可能需要圖像預處理以獲得最佳效果。

步驟1:安裝Tesseract

  • 官方GitHub倉庫下載並安裝Tesseract OCR。
  • 將Tesseract文件夾添加到PATH環境變數以便從終端訪問。

步驟2:在圖像上運行OCR

  • 打開終端並導航到包含圖像的文件夾。
  • 執行以下命令:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
SHELL

步驟3:查看結果

  • 打開生成的文本文件(output.txt)以查看提取的文本。

3. ABBYY FineReader Online

ABBYY FineReader Online 是一個雲端OCR服務,允許用戶將掃描文件和圖像轉換為可編輯格式。

這個在線工具提供了一個免費的基於OCR的在線文本轉換器,可以輕鬆從圖像中提取文本。

OCR照片(初學者教程):圖3

優勢

  • 用戶友好的圖片OCR工具
  • 支持多種輸入格式
  • 保留文檔格式

劣勢

  • 免費使用有一定限制
  • 需要網際網路連接

步驟1:訪問ABBYY FineReader Online

  • 前往ABBYY FineReader Online網站。
  • 下載Windows或Mac的免費試用版。
  • 安裝軟件並按照給定步驟進行操作。

步驟2:上傳圖像

  • 點擊“選擇文件”按鈕並上傳您的圖像。

步驟3:處理圖像

  • 等待圖像處理完成。 該工具將自動提取文本。

步驟4:編輯文本

  • 保存提取的文本或使用編輯器進行必要的修正。
  • 保存為Word、Excel和Text格式。

4. Online OCR

Online OCR是一個基於Web的OCR服務,支持多語言的在線圖像到文字轉換。 用戶可以直接從其設備上傳圖像或提供網址。

優勢

  • 簡單的用戶界面
  • 支持多種輸入格式
  • 免費使用,但有限制

劣勢

  • 免費功能有限
  • 需要網絡連接

步驟1:訪問Online OCR

前往Online OCR網站。

步驟2:上傳圖像

點擊“選擇文件”按鈕並上傳您的圖像。

OCR照片(初學者教程):圖4

步驟3:選擇語言和輸出格式

選擇圖像中文本的語言和輸出格式。

OCR照片(初學者教程):圖5

步驟4:開始OCR

點擊“轉換”按鈕以開始OCR過程。

步驟5:下載文本

過程完成後,從提供的鏈接下載提取的文本。

OCR照片(初學者教程):圖6

IronOCR在C#中的介紹

現在,讓我們深入了解IronOCR,這是一個用於C#的強大OCR庫,為開發者提供無縫實現OCR功能的工具。 IronOCR是由Iron Software團隊開發的領先OCR庫,專為C#開發者設計,提供強大的一套功能用于準確而無縫地從圖像中提取文本。

IronOCR作為一個堅固的光學字符識別(OCR)庫而脫穎而出,專為C#開發者設計,提供強大的一套功能以準確且無縫地從圖片中提取文本。

以其可靠性和效率著稱,IronOCR已經在尋求從圖像和文件中提取文本的C#開發者中獲得了人氣。

IronOCR專注於準確性和多樣性,已成為從文檔管理系統到數據提取應用程序項目的首選。

利用先進的OCR算法,IronOCR在準確解讀JPEG、PNG和TIFF等各種圖像格式的文本時表現出色。 其靈活性還體現在多語言支持上,成為迎合多語言需求應用程序的寶貴工具。

此庫與流行的.NET框架無縫整合,簡化了在C#應用程序中實現OCR功能的過程。

無論您是在處理掃描文檔還是圖像,IronOCR的全面功能都讓開發人員能輕鬆地將OCR功能整合到他們的項目中。

IronOCR功能詳解

  1. 先進的OCR算法:IronOCR採用成熟的OCR算法,超越基本字符識別,即使在複雜場景中也能保證高精度。
  2. 圖像格式支持: 開發者可以利用IronOCR對多種圖像格式的支持,例如JPEG, PNG和TIFF,提供處理多樣視覺內容的靈活性。
  3. 多語言支持: 鑑於應用程序的全球性特性,IronOCR 配備多語言支持,能夠精確地提取不同語言的文本。
  4. PDF文本提取: 除了圖像之外,IronOCR 還擴展了其能力以從PDF文檔中提取文本,在文件以數字格式存儲的情景中提升了其適用性。
  5. 與.NET框架的整合: IronOCR與流行的.NET框架無縫整合,令C#開發者能在不需要繁瑣配置的前提下輕鬆地將OCR功能引入其項目。

在C#中使用IronOCR實現OCR

以下是使用IronOCR在C#中從圖像提取文字的簡單示例:

using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
Imports IronOcr ' Import the IronOcr namespace

' Create an instance of IronTesseract
Private ocr = New IronTesseract()

' Read text from the specified image file
Private imageText As String = ocr.Read("images\image.png").Text

' Output the extracted text
Console.WriteLine(imageText)
$vbLabelText   $csharpLabel

這段簡單的C#代碼片段展示了如何使用IronOCR從圖像文件中讀取文字。開發者可以根據自己的特定要求進一步自定義OCR過程。

有關IronOCR的高階功能的詳細信息,請訪問文檔頁面。

結論

OCR照片工具在從圖像中數字化文本內容方面發揮著關鍵作用。 儘管各種在線工具提供方便,IronOCR為開發者提供了一個強大而靈活的解決方案,將OCR能力整合到其C#應用程序中。

在線工具和程式化實現的庫之間的選擇取決於如精確性要求、定制需求以及開發者尋求對OCR過程的控制程度等因素。

IronOCR確實提供一個免費試用,需要註冊。 從這裡下載軟件。

Kannaopat Udonpant
軟體工程師
在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。