OCR 工具

如何將書寫掃描成文字(初學者教程)

發佈 2023年11月29日
分享:

介紹

在數位資訊的世界中,將手寫或印刷文本從掃描文件轉換為可編輯和可搜尋的格式的能力變得至關重要。 光學字符識別(光學字符識別)技術在這個過程中扮演著關鍵角色,使從圖像中提取文本信息成為可能。

在本文中,我們將探討使用 Tesseract(一個開源的 OCR 引擎)進行掃描轉文字的基本原理,並稍後介紹IronOCR作為一個強大且具備先進功能的替代方案,能夠將手寫、數字文本和掃描文件轉換為可編輯文本,並附有代碼示例。

了解 OCR 技術

OCR 技術利用複雜的算法來識別和解釋圖像中打印或手寫字符的模式。 它基本上彌合了物理世界和數字世界之間的差距,使我們能夠從各種來源(包括掃描文件、掃描手寫、PDF、掃描圖像文件,甚至是識別手寫)中捕捉並數位化文本。

Tesseract:一個開源的OCR解決方案

理解 Tesseract

Tesseract由 Google 開發的開源 OCR 引擎,廣泛用於將各種類型的掃描文檔,包括手寫文本、掃描圖像和 PDF 文檔,轉換為機器可讀的可編輯文本。 它支持多種語言,因其準確性和多功能性而受到歡迎。 讓我們深入了解使用 Tesseract 將掃描寫入文字的關鍵功能和步驟。

Tesseract 的主要功能

  1. 多功能性:Tesseract 支援多種輸入格式,使其適用於各種應用,包括掃描文件、圖像和 PDF。

  2. 語言支援:Tesseract 被設計用來識別多種語言的文本,是國際化用戶和開發人員處理不同語言上下文的文件時的一個靈活解決方案。

  3. 開源社群:Tesseract 的開源性質促成了一個穩健的開發者社群,他們持續貢獻以促進其改進。 定期更新和增強確保 Tesseract 保持作為一個具有競爭力的 OCR 解決方案。

  4. OCR 精度:Tesseract 以其在識別文本方面的精確性而著稱,即使在字體、風格和圖像質量各異的複雜情境中也是如此。

使用 Tesseract 的步驟

在 Windows 中使用 Tesseract OCR 來轉換手寫筆記或解讀難以辨認的筆跡需要幾個步驟。 以下是基本指南:

  1. 安裝 Tesseract OCR:

    • 從官方 GitHub UB Mannheim 資源庫下載適用於 Windows 的 Tesseract 安裝程式:Tesseract OCR 可执行文件.

    • 執行安裝程式並按照螢幕上的指示完成安裝。

    使用 Tesseract OCR 安裝程式安裝 Tesseract。

    • 選擇位置並記住安裝路徑,因為稍後將用於設定 Path 變數。

    選擇目標資料夾位置以在您的系統上安裝Tesseract。

  2. 設定環境變數:

    • 將 Tesseract 安裝目錄添加到系統的 PATH 環境變數中。 這可確保從任何命令提示字元窗口都能存取 Tesseract 可執行文件。

    在系統屬性中,將 Tesseract 安裝目錄路徑添加到系統的 PATH 環境變數中。 這可確保從任何命令提示字元窗口都能存取 Tesseract 可執行文件。點擊環境變數按鈕。 在「環境變數」窗口中,點擊「編輯」系統變數。在「編輯環境變數」標籤中,點擊「新增」按鈕並輸入 Tesseract 目錄路徑位置。 點擊「確定」。

  3. 命令列使用:

    • 開啟命令提示字元視窗並導航至包含您的影像或掃描手寫文件的目錄。

    • 使用以下命令對影像進行OCR並將結果輸出到文本文件:
    tesseract input_image.png output_text.txt
    tesseract input_image.png output_text.txt
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract input_image.png output_text.txt
VB   C#

將 input_image.png 替換為您的圖像檔案名稱,並將 output_text.txt 替換為您想要的輸出文本檔案名稱。

  1. 後處理:根據需求,可能需要進行後處理步驟來完善提取的文本,例如去除不必要的字符或格式化。

    雖然Tesseract是個強大的工具,但開發人員經常尋求替代方案,以提供更多功能、定制選項以及更容易整合到他們的應用程式中。 這就是IronOCR發揮作用。

介紹IronOCR:將掃描文檔提升為文字

理解 IronOCR

IronOCR是一個 .NET OCR 函式庫,超越 Tesseract 的功能,為開發人員提供進階功能與自訂選項。 無論是處理掃描文件、圖像,還是掃描的 PDF,IronOCR 都提供了準確提取文本的強大解決方案。 讓我們探討 IronOCR 的關鍵功能,以及它如何增強掃描寫入文本的過程。

IronOCR 的主要功能

  1. 準確性:IronOCR 採用最先進的OCR演算法,確保文字識別的高度準確性。 在具有挑戰性的場景中表現卓越,如低品質圖像或複雜字體。

  2. 多功能性:IronOCR 支援各種輸入格式,包括影像和 PDF 檔案,適應多樣化的使用案例,這使其成為開發人員的多功能選擇。

  3. 語言支持:IronOCR 為全球用戶提供服務,支持多種國際語言,確保在不同語言環境中的文件進行有效的 OCR 處理。

  4. 易於整合:IronOCR的一大特色是能夠無縫整合到.NET應用程式中。 開發人員可以輕鬆將 IronOCR 整合到他們的專案中,從而有效地實現 OCR 功能。

IronOCR:程式碼範例

讓我們簡單地IronTesseract 5在 .NET 應用程式中使用 IronOCR 的程式碼片段:

using IronOcr;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

    // This is done by default and can be omitted:
    // ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

    using (var ocrInput = new OcrInput(@"images\image.png"))
    {
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
    }
}
using IronOcr;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

    // This is done by default and can be omitted:
    // ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

    using (var ocrInput = new OcrInput(@"images\image.png"))
    {
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
    }
}
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()

	' This is done by default and can be omitted:
	' ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

	Using ocrInput As New OcrInput("images\image.png")
		Dim ocrResult = ocrTesseract.Read(ocrInput)
		Console.WriteLine(ocrResult.Text)
	End Using
	End Sub
End Class
VB   C#

在此範例中,IronOCR 提供了一個更簡單且面向對象的方法,允許開發人員透過高效的 IronTesseract 5 OCR 引擎直接從圖像中讀取打印或手寫的文字。欲了解更多詳細資訊,請訪問文檔頁面。

結論

儘管 Tesseract 仍然是一個強大的開源 OCR 引擎,IronOCR提供增強功能、自訂選項及易於整合的特性,適合在.NET生態系統中工作的開發人員。 在 Tesseract 和 IronOCR 之間的選擇取決於專案的具體要求以及對 OCR 過程的控制程度。 隨著從掃描文件準確提取文本的需求不斷增長,像 IronOCR 這樣的 OCR 工具在塑造信息可訪問性和數位文件管理的未來方面發揮著關鍵作用。

IronOCR 提供一個免費試用讓用戶體驗其先進的OCR功能,而商業許可證需要用於專業和商業用途。 要探索 IronOCR 的全部潛力,請直接從官方網站.

< 上一頁
阿拉伯文文字識別工具:提高準確性
下一個 >
如何在 Python 中建立 OCR

準備開始了嗎? 版本: 2024.11 剛剛發布

免費 NuGet 下載 總下載次數: 2,698,613 查看許可證 >