OCR 工具

如何將圖片轉換為文字

發佈 2024年10月24日
分享:

在當前的數位時代,將以圖像為基礎的內容轉換為易於閱讀、可編輯和可搜尋的文字。 這在像是存檔紙質文件、從圖像中提取關鍵信息或數字化手寫或印刷材料等情境中特別重要。 光學字符識別(光學字符識別)技術提供了一種解決方案來自動化此轉換過程。 一個非常可靠且高效的工具是IronOCR,這是一個強大的 .NET OCR 庫。

本文將解釋如何使用圖片轉換成文字IronOCR,並探討此轉換如何省時、減少錯誤以及簡化數據提取、歸檔和文件處理等流程。

如何將圖片轉換為文字

  1. 下載 C# 庫以進行 OCR 工作

  2. 建立一個新的 `IronTesseract实例

  3. 使用 ` 加載您的圖像OcrImageInput\

  4. 使用`讀取圖像的內容OcrRead\

  5. 將 OCR 結果導出到文字檔案中

為什麼要將圖片轉換為文字?

您可能想將圖片轉換為文字的原因有很多,包括:

  • 資料提取: 從掃描的文件和圖像中提取文字,用於歸檔或數據處理目的。
  • 編輯掃描內容: 編輯或更新先前已掃描文件中的文字,省去手動重新輸入內容的時間。
  • 提升可及性:將印刷材料轉換為數位文本,使其可供螢幕閱讀器或文字轉語音應用程式使用。
  • 自動化: 透過從發票、收據或名片中讀取文字來自動化資料輸入和處理。

如何開始將圖像轉換為文字

在我们探讨如何利用IronOCR强大的图像转文字功能从图像中提取文字之前,让我们先了解一下使用在线工具的一般分步流程,docsumo. 線上 OCR 工具是對於那些想要執行簡單或偶發 OCR 任務的人來說,是一個有用的選擇,因為它們不需要任何手動設置。 當然,如果您需要定期執行 OCR 任務,那麼擁有一個強大的 OCR 工具,例如 IronOCR,可能會對您更有幫助。

  1. 導航至線上OCR工具

  2. 上傳您的圖片並開始提取過程

  3. 將結果數據下載為文本文件

步驟一:導航至在線OCR工具

要開始使用光學字符識別(OCR)技術從圖像文件中提取文字,我們首先需要導航到我們想要使用的在線圖像OCR工具。

如何將圖片轉換為文字:圖1 - Docsumo OCR 工具

第 2 步:上傳您的圖片並開始提取過程

現在,通過點擊“上傳文件”按鈕,我們可以上傳我們想要提取文字的圖像文件。 工具將立即開始處理圖像。

如何將圖片轉換為文字:圖 2 - Docsumo - 文件處理

步驟三:將結果數據下載為文本文件

現在圖像已完成處理,我們可以將提取的文字下載為新的文本檔,以便進一步使用或操作。

如何將圖片轉換為文本:圖 3 - Docsumo - 圖像處理完成

您也可以查看檔案,突出顯示各個部分以查看其內含的文字。 這可能特別有用,若您只想查看某些部分中的文本。 然後,您仍然可以將文本下載為文本檔、XLS 或 JSON。

如何將圖片轉換為文字:圖4

開始使用IronOCR

IronOCR是一個多功能的 .NET 庫,允許您對圖像執行 OCR 操作。 提供廣泛功能,可以處理各種文件格式(例如 PNG、JPEG、TIFF 和 PDF),進行圖像校正,掃描專業文件(護照、車牌等),提供掃描文件的高級信息,轉換掃描文件,並突出顯示文字。

安裝 IronOCR 函式庫

在使用 IronOCR 開始讀取圖片之前,您需要先安裝它,如果您的專案中尚未安裝。 您可以在 Visual Studio 中使用 NuGet 輕鬆安裝 IronOCR。 打開 NuGet 套件管理器控制台,並運行以下命令:

Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
VB   C#

或者,您可以通過在解決方案包管理器頁面中搜索 IronOCR,來安裝 IronOCR。

如何將圖片轉換為文字:圖5

要在程式碼中使用IronOCR,請確保在程式碼頂部有適當的導入語句:

using IronOcr;
using IronOcr;
Imports IronOcr
VB   C#

將圖片轉換為文字:基礎範例

首先,讓我們看看使用IronOCR進行基本的圖像轉文本範例。 這是任何 OCR 工具的核心功能,針對此示例,我們將使用我們用於在線工具的 PNG 文件。 在此範例中,我們首先實例化了IronTesseract類別並將其分配給變數 'ocr'。 然後我們使用OcrImageInputclass 以提供的圖像文件創建新的 OcrImageInput 對象。 最後,該讀取** 方法用於從圖像中讀取文本並返回一個[OcrResult](/csharp/ocr/object-reference/api/IronOcr.OcrResult.html)物件。 然後,我們可以存取擷取的文字並將其顯示在控制台上使用[ocrResult.Text**](/csharp/ocr/object-reference/api/IronOcr.OcrResult.html#IronOcr_OcrResult_Text).

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
VB   C#

輸出圖像

如何將圖片轉換為文字:圖 6

處理不同的圖片格式

IronOCR 支援多種圖像格式,如 PNG、JPEG、BMP、GIF 和 TIFF。 從不同圖像格式讀取文本的過程保持不變,您只需載入具有正確擴展名的檔案即可。

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
VB   C#

提高光學字符識別準確度

可以通过优化图像和配置语言、图像分辨率以及图像中的噪声级别等选项来提高OCR性能。 以下是您可以如何微調OCR,以提高從需要通過以下方式提高質量的圖像中提取文本的準確性:去噪()**銳化()方法:

using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Using IronOcr IronTesseract ocr = New IronTesseract()
	Using image As New OcrImageInput("example.png")
		image.DeNoise()
		image.Sharpen()
		Dim ocrResult As OcrResult = ocr.Read(image)
		Console.WriteLine(ocrResult.Text)
	End Using
End Using
VB   C#

匯出提取的文本

現在我們知道圖像轉文字過程的基本知識,讓我們來看看如何將生成的文字匯出以供日後使用。 在這個例子中,我們將使用與之前相同的過程來加載圖像並掃描它。 然後,使用 File.WriteAllText("output.txt",ocrResult.Text)我們創建一個名為 output.txt** 的新文本檔案,並將提取的文本保存到該檔案中。

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
File.WriteAllText("output.txt", ocrResult.Text)
VB   C#

如何將圖片轉換為文字:圖7

IronOCR的主要功能

  1. 高準確度:IronOCR 使用先進的TesseractOCR 算法並包含內建工具來處理複雜圖像,確保高準確性。

  2. 多語言支持支援超過 125 種語言,包括多種書寫系統,如拉丁字母、斯拉夫字母、阿拉伯字母和亞洲字符。 然而需要注意的是,IronOCR 內建安裝的語言僅包括英語,若要使用其他語言,您需要為該語言安裝額外的語言包。

  3. PDF OCR:IronOCR 可以從掃描的PDF檔案,使其成為文件數位化的重要工具。

  4. Image Cleanup: 它提供預處理工具,如去傾斜, 噪聲去除,和反轉提高影像品質以改善 OCR 準確性。

  5. 輕鬆整合:API 可輕鬆無縫整合到任何 .NET 專案中,無論是主控台應用程式、網頁應用程式還是桌面軟體。

將圖片轉換為文字的常見用例

  • 自動化資料輸入:企業可以使用OCR從表格、收據或名片中自動提取資料。
  • 文件存檔:組織可以將實體文件數位化,使其可搜尋且更易於儲存。
  • 無障礙功能:將印刷資料轉換為文字,以供螢幕閱讀器或其他輔助技術使用。
  • 研究與分析:快速將掃描的研究材料轉換為文本,以便進行分析或整合到其他軟體工具中。
  • 研究: 將掃描的研究筆記轉換為可編輯的文字,然後您可以將其保存為 Word 文檔,以便在如 IronWord、Microsoft Word 或 Google 文檔等工具中進一步操作。

結論

使用 IronOCR 從圖片中轉換文字是處理文檔處理任務的一種快速、準確且有效的方法。 無論您是處理掃描文件、數位圖像還是 PDF 文件,IronOCR 簡化了過程,提供高精準度、多語言支持和強大的圖像處理工具。 此工具非常適合希望簡化文件管理工作流程、自動化數據提取或增強可訪問性的企業。

使用免費試用若要親自體驗 IronOCR 強大的功能,您只需幾分鐘即可在您的工作區內完全運行它,讓您可以立刻開始處理 OCR 任務。!

下一個 >
收據OCR庫(開發人員清單)

準備開始了嗎? 版本: 2024.11 剛剛發布

免費 NuGet 下載 總下載次數: 2,698,613 查看許可證 >