OCR 工具

如何將書寫掃描成文字(初學者教程)

發佈 2023年11月29日
分享:

簡介

在數位資訊的世界中,將手寫或列印的文字從掃描文件轉換為可編輯和可搜索的格式能力已變得至關重要。光學字符識別 (光學字符識別) 技術在這個過程中扮演了關鍵角色,使從圖像中提取文本信息成為可能。

在本文中,我們將探討使用 Tesseract 開源 OCR 引擎進行掃描寫入文本的基本原理,並稍後介紹 IronOCR 作為一個強大且具備先進功能的替代方案,能夠將手寫、數字文本和掃描文件轉換為可編輯文本,並附有代碼示例。

理解光學字符識別技術

光學字符識別技術利用先進的算法來識別和解釋影像中印刷或手寫字符的模式。它本質上架起了物理世界和數字世界之間的橋樑,使我們能夠從多種來源捕捉和數字化文本,包括掃描文檔、掃描手寫、PDF、掃描圖像文件,甚至是識別手寫內容。

Tesseract:一個開源的OCR解決方案

瞭解 Tesseract

Tesseract由 Google 開發,是一個廣泛用於將各種掃描文件(包括手寫文字、掃描圖像和 PDF 文件)轉換為可機讀的可編輯文本的開源 OCR 引擎。它支持多種語言,並因其準確性和多功能性而獲得了廣泛的普及度。讓我們深入了解使用 Tesseract 將掃描文檔轉換為文本的主要特點和步驟。

Tesseract 的主要功能

  1. 多功能性: Tesseract 支援多種輸入格式,適用於各種應用,包括掃描文件、圖像和 PDF。

  2. 語言支援: Tesseract 設計上能夠識別多種語言的文本,為國際用戶和需要處理不同語言文件的開發人員提供靈活的解決方案。

  3. 開源社群: 開源的 Tesseract 擁有強大的開發者社群,持續改進其功能。定期更新和增強確保 Tesseract 保持競爭力的 OCR 解決方案。

  4. OCR 精準度: Tesseract 以其準確度著稱,即使在字體、樣式和圖像品質多變的複雜情境下也能有效識別文字。

使用 Tesseract 的步驟

使用 Tesseract OCR 將手寫筆記轉換為數位文本,或解讀難以辨識的手寫字在 Windows 上需要一些步驟。以下是基本指南:

  1. 安裝 Tesseract OCR:

    • 從官方 GitHub UB Mannheim 存儲庫下載 Tesseract 安裝程式: Tesseract OCR 可执行文件.
    • 執行安裝程式並按照螢幕上的指示完成安裝。

    使用 Tesseract OCR 安裝程式安裝 Tesseract。

    • 選擇安裝位置並記住路徑,因為稍後會在 Path 變數中設定。

    選擇目標資料夾位置以在您的系統上安裝Tesseract。

  2. 設置環境變量:

    • 將Tesseract安裝目錄添加到系統的PATH環境變量中。這確保可以從任何命令提示符窗口訪問Tesseract可執行文件。

    在系統屬性中,將 Tesseract 安裝目錄路徑添加到系統的 PATH 環境變量。這樣可以確保從任何命令提示符窗口訪問 Tesseract 可執行文件。點擊環境變數按鈕。在環境變數窗口中,點擊「編輯」系統變數。在「編輯環境變數」標籤中,點擊「新增」按鈕並添加Tesseract目錄路徑位置。點擊「確定」。

  3. 命令行使用:

    • 打開命令提示字元視窗並導航到包含您的圖像或掃描手寫文件的目錄。

    • 使用以下命令對圖像進行OCR並將結果輸出到文本文件:
    tesseract input_image.png output_text.txt
    tesseract input_image.png output_text.txt
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract input_image.png output_text.txt
VB   C#

將 input_image.png 替換為您的圖像文件名,並將 output_text.txt 替換為所需的輸出文本文件名。

  1. 後處理:根據需求,可能需要後處理步驟以精緻提取的文本,例如刪除不必要的字符或格式化。

雖然 Tesseract 是一個強大的工具,但開發人員通常會尋找具有額外功能、自定義選項和易於集成到他們應用程序中的替代方案。這就是 IronOCR 所在的地方。 IronOCR 發揮作用。

介紹IronOCR:將掃描文檔提升為文字

理解 IronOCR

IronOCR 是一個.NET的OCR程式庫,超越了Tesseract的能力,為開發者提供了先進的功能和自定義選項。無論是處理掃描文件、圖像還是掃描PDF,IronOCR都能提供精確文本提取的強大解決方案。讓我們探討IronOCR的主要功能以及它如何提升掃描文字轉換的過程。

IronOCR 的主要功能

  1. 準確性:IronOCR 利用最先進的 OCR 演算法,確保文本識別的高準確性。在低質量圖像或複雜字型等挑戰性場景中也能表現出色。

  2. 多功能性:支援多種輸入格式,包括圖像和 PDF 文件,IronOCR 能適應各種用途,使其成為開發者的多功能選擇。

  3. 語言支援:IronOCR 通過支援多種國際語言來滿足全球受眾,確保適用于不同語言環境中的文件 OCR 處理。

  4. 易整合性:IronOCR 的一大亮點是其無縫整合 .NET 應用程式。開發者可以輕鬆將 IronOCR 融入其項目中,從而有效實現 OCR 功能。

IronOCR: 範例代碼

讓我們來一個簡單的示例 IronTesseract 5 在 .NET 應用程式中使用 IronOCR 的程式碼片段:

using IronOcr;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

    // This is done by default and can be omitted:
    // ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

    using (var ocrInput = new OcrInput(@"images\image.png"))
    {
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
    }
}
using IronOcr;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

    // This is done by default and can be omitted:
    // ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

    using (var ocrInput = new OcrInput(@"images\image.png"))
    {
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
    }
}
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()

	' This is done by default and can be omitted:
	' ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

	Using ocrInput As New OcrInput("images\image.png")
		Dim ocrResult = ocrTesseract.Read(ocrInput)
		Console.WriteLine(ocrResult.Text)
	End Using
	End Sub
End Class
VB   C#

在此範例中,IronOCR 提供了一個更簡單且面向對象的方法,允許開發人員透過高效的 IronTesseract 5 OCR 引擎直接從圖像中讀取打印或手寫的文字。欲了解更多詳細資訊,請訪問 文檔 頁面。

結論

雖然 Tesseract 仍然是一個強大的開源 OCR 引擎, IronOCR 提供增強功能、自訂選項,並為在 .NET 生態系統中工作的開發人員提供易於整合的特性。在 Tesseract 和 IronOCR 之間的選擇取決於專案的具體需求以及對 OCR 過程的控制水平需求。隨著對從掃描文件中精確提取文本的需求不斷增長,像 IronOCR 這樣的 OCR 工具在塑造信息可訪問性和數位文件管理的未來方面扮演著關鍵角色。

IronOCR 提供 免費試用 讓用戶體驗其先進的OCR功能,而商業 許可證 需要用於專業和商業用途。 要探索 IronOCR 的全部潛力,請直接從 官方網站.

< 上一頁
阿拉伯文文字識別(免費和線上工具)
下一個 >
如何在 Python 中建立 OCR

準備開始了嗎? 版本: 2024.9 剛剛發布

免費 NuGet 下載 總下載次數: 2,326,578 查看許可證 >