在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
在當前的數位時代,將以圖像為基礎的內容轉換為易於閱讀、可編輯和可搜尋的文字。 這在像是存檔紙質文件、從圖像中提取關鍵信息或數字化手寫或印刷材料等情境中特別重要。 光學字符識別(光學字符識別)技術提供了一種解決方案來自動化此轉換過程。 一個非常可靠且高效的工具是IronOCR,這是一個強大的 .NET OCR 庫。
本文將解釋如何使用圖片轉換成文字IronOCR,並探討此轉換如何省時、減少錯誤以及簡化數據提取、歸檔和文件處理等流程。
建立一個新的 `IronTesseract实例
使用 ` 加載您的圖像OcrImageInput\
使用`讀取圖像的內容OcrRead\
您可能想將圖片轉換為文字的原因有很多,包括:
在我们探讨如何利用IronOCR强大的图像转文字功能从图像中提取文字之前,让我们先了解一下使用在线工具的一般分步流程,docsumo. 線上 OCR 工具是對於那些想要執行簡單或偶發 OCR 任務的人來說,是一個有用的選擇,因為它們不需要任何手動設置。 當然,如果您需要定期執行 OCR 任務,那麼擁有一個強大的 OCR 工具,例如 IronOCR,可能會對您更有幫助。
導航至線上OCR工具
上傳您的圖片並開始提取過程
要開始使用光學字符識別(OCR)技術從圖像文件中提取文字,我們首先需要導航到我們想要使用的在線圖像OCR工具。
現在,通過點擊“上傳文件”按鈕,我們可以上傳我們想要提取文字的圖像文件。 工具將立即開始處理圖像。
現在圖像已完成處理,我們可以將提取的文字下載為新的文本檔,以便進一步使用或操作。
您也可以查看檔案,突出顯示各個部分以查看其內含的文字。 這可能特別有用,若您只想查看某些部分中的文本。 然後,您仍然可以將文本下載為文本檔、XLS 或 JSON。
IronOCR是一個多功能的 .NET 庫,允許您對圖像執行 OCR 操作。 提供廣泛功能,可以處理各種文件格式(例如 PNG、JPEG、TIFF 和 PDF),進行圖像校正,掃描專業文件(護照、車牌等),提供掃描文件的高級信息,轉換掃描文件,並突出顯示文字。
在使用 IronOCR 開始讀取圖片之前,您需要先安裝它,如果您的專案中尚未安裝。 您可以在 Visual Studio 中使用 NuGet 輕鬆安裝 IronOCR。 打開 NuGet 套件管理器控制台,並運行以下命令:
Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
或者,您可以通過在解決方案包管理器頁面中搜索 IronOCR,來安裝 IronOCR。
要在程式碼中使用IronOCR,請確保在程式碼頂部有適當的導入語句:
using IronOcr;
using IronOcr;
Imports IronOcr
首先,讓我們看看使用IronOCR進行基本的圖像轉文本範例。 這是任何 OCR 工具的核心功能,針對此示例,我們將使用我們用於在線工具的 PNG 文件。 在此範例中,我們首先實例化了IronTesseract類別並將其分配給變數 'ocr'。 然後我們使用OcrImageInputclass 以提供的圖像文件創建新的 OcrImageInput 對象。 最後,該讀取** 方法用於從圖像中讀取文本並返回一個[OcrResult](/csharp/ocr/object-reference/api/IronOcr.OcrResult.html)物件。 然後,我們可以存取擷取的文字並將其顯示在控制台上使用[ocrResult.Text**](/csharp/ocr/object-reference/api/IronOcr.OcrResult.html#IronOcr_OcrResult_Text).
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
IronOCR 支援多種圖像格式,如 PNG、JPEG、BMP、GIF 和 TIFF。 從不同圖像格式讀取文本的過程保持不變,您只需載入具有正確擴展名的檔案即可。
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
可以通过优化图像和配置语言、图像分辨率以及图像中的噪声级别等选项来提高OCR性能。 以下是您可以如何微調OCR,以提高從需要通過以下方式提高質量的圖像中提取文本的準確性:去噪()**和銳化()方法:
using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Using IronOcr IronTesseract ocr = New IronTesseract()
Using image As New OcrImageInput("example.png")
image.DeNoise()
image.Sharpen()
Dim ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
End Using
End Using
現在我們知道圖像轉文字過程的基本知識,讓我們來看看如何將生成的文字匯出以供日後使用。 在這個例子中,我們將使用與之前相同的過程來加載圖像並掃描它。 然後,使用 File.WriteAllText("output.txt",ocrResult.Text)我們創建一個名為 output.txt** 的新文本檔案,並將提取的文本保存到該檔案中。
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
File.WriteAllText("output.txt", ocrResult.Text)
高準確度:IronOCR 使用先進的TesseractOCR 算法並包含內建工具來處理複雜圖像,確保高準確性。
多語言支持:支援超過 125 種語言,包括多種書寫系統,如拉丁字母、斯拉夫字母、阿拉伯字母和亞洲字符。 然而需要注意的是,IronOCR 內建安裝的語言僅包括英語,若要使用其他語言,您需要為該語言安裝額外的語言包。
PDF OCR:IronOCR 可以從掃描的PDF檔案,使其成為文件數位化的重要工具。
使用 IronOCR 從圖片中轉換文字是處理文檔處理任務的一種快速、準確且有效的方法。 無論您是處理掃描文件、數位圖像還是 PDF 文件,IronOCR 簡化了過程,提供高精準度、多語言支持和強大的圖像處理工具。 此工具非常適合希望簡化文件管理工作流程、自動化數據提取或增強可訪問性的企業。
使用免費試用若要親自體驗 IronOCR 強大的功能,您只需幾分鐘即可在您的工作區內完全運行它,讓您可以立刻開始處理 OCR 任務。!