OCR 工具

如何將圖片轉換為文字

在當前的數位時代,將以圖像為基礎的內容轉換為易於閱讀、可編輯和可搜尋的文字。 這在像存檔紙質文件、從圖像中提取關鍵信息或數位化印刷材料等情境中特別重要。 光學文字識別(OCR)技術提供了一種自動化此轉換過程的解決方案。 要實現這一點,一個高度可靠且高效的工具是IronOCR,一款專為 .NET 設計的強大 OCR 函式庫。

本文將說明如何使用IronOCR將圖片轉換為文字,並探討此轉換如何節省時間、減少錯誤以及簡化資料擷取、存檔和文件處理等流程。

如何將圖片轉換為文字

  1. 下載用於OCR工作的C#函式庫

  2. 創建一個新的`IronTesseract`實例

  3. 使用 `OcrImageInput` 加載您的圖像

  4. 使用 `OcrRead` 讀取圖像的內容

  5. 將 OCR 結果導出到文字檔案中

為什麼要將圖片轉換為文字?

您可能想將圖片轉換為文字的原因有很多,包括:

  • 資料提取:從掃描文件和圖像中提取文本,用於歸檔或數據處理目的。
  • 編輯掃描內容:編輯或更新先前掃描文件中的文字,節省手動重新鍵入內容的時間。
  • 提高無障礙性:將印刷材料轉換為數位文本,使其可供螢幕閱讀器或文字轉語音應用程式使用。
  • 自動化:透過從發票、收據或名片讀取文本,自動化資料輸入和處理。

如何開始將圖像轉換為文字

在我們探討如何利用IronOCR強大的圖像轉換為文字功能來從圖像中提取文字之前,讓我們先來看看使用線上工具docsumo的一般步驟。 線上 OCR 工具是對於那些想要執行簡單或偶發 OCR 任務的人來說,是一個有用的選擇,因為它們不需要任何手動設置。 當然,如果您需要定期執行 OCR 任務,那麼擁有一個強大的 OCR 工具,例如 IronOCR,可能會對您更有幫助。

  1. 導航至線上OCR工具

  2. 上傳您的圖片並開始提取過程

  3. 將結果數據下載為文本文件

步驟一:導航至在線OCR工具

要開始使用光學字符識別(OCR)技術從圖像文件中提取文字,我們首先需要導航到我們想要使用的在線圖像OCR工具。

如何將圖片轉換成文字:圖1 - Docsumo OCR 工具

第 2 步:上傳您的圖片並開始提取過程

現在,通過點擊“上傳文件”按鈕,我們可以上傳我們想要提取文字的圖像文件。 工具將立即開始處理圖像。

如何將圖片轉換為文字:圖 2 - Docsumo - 檔案處理

步驟三:將結果數據下載為文本文件

現在圖像已完成處理,我們可以將提取的文字下載為新的文本檔,以便進一步使用或操作。

如何將圖片轉為文字:圖 3 - Docsumo - 圖像處理完成

您也可以查看檔案,突出顯示各個部分以查看其內含的文字。 這可能特別有用,若您只想查看某些部分中的文本。 然後,您仍然可以將文本下載為文本檔、XLS 或 JSON。

如何將圖片轉換為文字:圖4

開始使用IronOCR

IronOCR 是一個多功能的 .NET 函式庫,允許您對圖像進行 OCR 操作。 具備廣泛的功能,它可以處理多種文件格式(例如 PNG、JPEG、TIFF 和 PDF),進行圖像校正,掃描專業文件(護照、車牌等),提供關於掃描文件的進階資訊,轉換掃描文件,並高亮顯示文字。

安裝 IronOCR 函式庫

在使用 IronOCR 開始讀取圖片之前,您需要先安裝它,如果您的專案中尚未安裝。 您可以在 Visual Studio 中使用 NuGet 輕鬆安裝 IronOCR。 打開 NuGet 套件管理器控制台,並運行以下命令:

Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
$vbLabelText   $csharpLabel

或者,您可以通過在解決方案包管理器頁面中搜索 IronOCR,來安裝 IronOCR。

如何將圖片轉換為文字:圖 5

要在程式碼中使用IronOCR,請確保在程式碼頂部有適當的導入語句:

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

將圖片轉換為文字:基礎範例

首先,讓我們看看使用IronOCR進行基本的圖像轉文本範例。 這是任何 OCR 工具的核心功能,針對此示例,我們將使用我們用於在線工具的 PNG 文件。 在此範例中,我們首先實例化了IronTesseract類別,並將其賦值給變數'ocr'。 然後,我們使用OcrImageInput類從提供的圖像檔案創建新的OcrImageInput物件。 最後,Read 方法用於從圖像中讀取文本,並返回一個 OcrResult 對象。 然後,我們可以存取提取的文字,並使用ocrResult.Text將其顯示在控制台上。

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

輸出圖像

如何將圖片轉換為文字:圖 6

處理不同的圖片格式

IronOCR 支援多種圖像格式,如 PNG、JPEG、BMP、GIF 和 TIFF。 從不同圖像格式讀取文本的過程保持不變,您只需載入具有正確擴展名的檔案即可。

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

提高光學字符識別準確度

可以通过优化图像和配置语言、图像分辨率以及图像中的噪声级别等选项来提高OCR性能。 以下是如何調整 OCR 以提高文字提取準確性的方法,適用於需要通過使用 DeNoise()Sharpen() 方法改善質量的圖像:

using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Using IronOcr IronTesseract ocr = New IronTesseract()
	Using image As New OcrImageInput("example.png")
		image.DeNoise()
		image.Sharpen()
		Dim ocrResult As OcrResult = ocr.Read(image)
		Console.WriteLine(ocrResult.Text)
	End Using
End Using
$vbLabelText   $csharpLabel

匯出提取的文本

現在我們知道圖像轉文字過程的基本知識,讓我們來看看如何將生成的文字匯出以供日後使用。 在這個例子中,我們將使用與之前相同的過程來加載圖像並掃描它。 然後,使用 File.WriteAllText("output.txt", ocrResult.Text),我們創建一個名為 'output.txt' 的新文字檔案,並將擷取的文字保存到該檔案。

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
File.WriteAllText("output.txt", ocrResult.Text)
$vbLabelText   $csharpLabel

如何將圖片轉換為文字:圖 7

IronOCR的主要功能

  1. 高精確度:IronOCR 使用先進的 Tesseract OCR 演算法,並內建工具處理複雜影像,確保高準確性。

  2. 多語言支持支持125多種語言,包括多種書寫系統,如拉丁文字、斯拉夫文字、阿拉伯文字和亞洲字符。 然而需要注意的是,IronOCR 內建安裝的語言僅包括英語,若要使用其他語言,您需要為該語言安裝額外的語言包。

  3. PDF OCR:IronOCR 可以從掃描的 PDF中提取文本,使其成為文檔數字化的重要工具。

  4. 影像清理:提供如校正傾斜去除噪音反相等預處理工具,以提高影像品質,從而提升OCR的準確性。

  5. 輕鬆整合:該 API 可無縫整合到任何 .NET 專案中,無論是控制台應用程式、網頁應用程式,還是桌面軟體。

將圖片轉換為文字的常見用例

  • 自動化資料錄入:企業可以使用OCR自動從表單、收據或商業名片中提取資料。
  • 文件歸檔:組織可以將實體文件數位化,使其可搜索且更易於存儲。
  • 可及性:將印刷材料轉換為文字,以供螢幕閱讀器或其他輔助技術使用。
  • 研究與分析:快速將掃描的研究材料轉換為文本,以便分析或整合到其他軟體工具中。
  • 學習:將掃描的學習筆記轉換為可編輯的文字,然後保存為 Word 文件,以便在 IronWord、Microsoft Word 或 Google 文件等工具中進一步操作。

結論

使用 IronOCR 從圖片中轉換文字是處理文檔處理任務的一種快速、準確且有效的方法。 無論您是處理掃描文件、數位圖像還是 PDF 文件,IronOCR 簡化了過程,提供高精準度、多語言支持和強大的圖像處理工具。 此工具非常適合希望簡化文件管理工作流程、自動化數據提取或增強可訪問性的企業。

使用免費試用來親自體驗IronOCR的強大功能,您只需幾分鐘即可在您的工作環境中完全運行它,這樣您就可以立刻開始處理OCR任務!

Kannaopat Udonpant
坎納帕特·烏頓潘
軟體工程師
在成為軟體工程師之前,Kannapat 在日本北海道大學完成了環境資源博士學位。在攻讀學位期間,Kannapat 也成為了車輛機器人實驗室的成員,該實驗室隸屬於生物生產工程學系。2022 年,他利用自己的 C# 技能,加入了 Iron Software 的工程團隊,專注於 IronPDF 的開發。Kannapat 珍視這份工作,因為他可以直接向負責撰寫大部分 IronPDF 程式碼的開發人員學習。除了同儕學習外,Kannapat 還享受在 Iron Software 工作的社交方面。當他不在撰寫程式碼或文件時,Kannapat 通常會在 PS5 上玩遊戲或重看《最後生還者》。
< 上一頁
Easyocr 與 Tesseract (OCR 功能比較)
下一個 >
收據OCR庫(開發人員清單)