在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
光學字符識別(光學字符識別)軟體已成為 C# 開發者和大企業不可或缺的工具,因為它能夠快速且精確地將掃描文件、圖像或 PDF 轉換為可編輯和可搜尋的文本。 Windows 10 提供多種 OCR 軟件選擇,每種選擇都有其獨特的功能集、優點和缺點。 在本文中,我們將探討適用於 Windows 10 的最佳 OCR 軟體解決方案,並介紹 IronOCR,一款強大的 C# 開發人員 OCR 函式庫。
ABBYY FineReader 是功能強大的免費 OCR 軟體,以其在從各種文檔格式中準確識別文本的卓越能力而廣受認可。 該軟體提供廣泛的功能,包括文件掃描、影像處理和文字識別,是 C# 開發人員和大型公司精簡文件管理流程的理想選擇。
使用 ABBYY FineReader,使用者可以輕鬆將掃描的文件、PDF 和數位影像轉換為可搜尋和編輯的檔案,例如 Word、Excel 和 PDF。 該軟體使用先進的光學字符識別技術,能夠準確識別文字、表格和圖形,即使是來自低品質的掃描或具有複雜佈局的文件。
要開始使用ABBYY FineReader,請下載並安裝該軟體。 打開應用程式並選擇所需的文件格式進行掃描。 匯入文件,選擇語言,然後點擊「識別」按鈕。 一旦 OCR 處理完成,請根據需要編輯並保存輸出。
Adobe Acrobat Pro DC是一個受歡迎的PDF管理工具,提供廣泛的功能,包括內建的OCR(光學字符識別)函數。 該軟體設計為個人和大型公司提供一體化解決方案,用於創建、編輯和管理 PDF 文件。
Acrobat Pro DC 是 Adobe Document Cloud 軟體套件的一部分。 它提供了先進的工具來創建和編輯 PDF,將各種文件格式轉換為 PDF,甚至合併多個 PDF 成為一個文件。 這款軟體還提供直觀的使用者介面和全面的 PDF 編輯工具,使使用者可以新增、刪除和修改文件的文字、圖片及其他元素。
Adobe Acrobat Pro DC 中的內建 OCR 功能使用戶能夠識別掃描文件或圖像中的文本,並將其轉換為可編輯和可搜尋的 PDF。 Adobe Acrobat Pro DC使用的OCR技術高度精確,能識別包括英語、法語、西班牙語等在內的多種語言的文本。
Readiris是功能強大且多用途的光學字符識別(OCR)軟體,提供高品質的文字識別並支援多種文件格式。 它被設計為針對個人用戶和大型公司,是尋找可處理各種文檔類型並具備有效擴展能力的OCR解決方案的C#開發人員的理想選擇。
Readiris 的其中一個主要功能是能夠從掃描文件、圖像和 PDF 文件中高精準地識別文字。 該軟體支援多種語言,例如中文、日文和韓文,並且可以處理複雜的版面和字體。 因此,它可以作為OCR掃描器運行。
Readiris 支援多種檔案格式作為輸出格式,包括 PDF、DOCX、XLSX 和 HTML,這表示使用者可以選擇最適合其需求的輸出格式。 該軟體還提供了一個使用者友好的介面,易於導航和自定義,使其成為各種專業水平使用者的理想選擇。
IronOCR是一個強大的OCR(光學字符識別)專為C#開發人員設計的庫。 它提供高效的光学字符识别(OCR)能力,並與 .NET 應用程式無縫整合,非常適合需要在其應用程式或工作流程中內建自定義 OCR 解決方案的大公司選擇。
它具備先進的OCR引擎,能夠在從各種文檔類型(包括紙質文檔、PDF和圖像)中識別文本時提供高精確性和速度。 支持超過120種語言,包括亞洲語言如中文、日文和韓文。
IronOCR 專為與 .NET 應用程式的輕鬆整合而設計,且提供全面的文件和範例代碼,幫助開發人員迅速上手。 它還提供多種自訂選項,允許開發人員設置自訂的 OCR 流程、配置 OCR 設定,並根據他們的具體需求創建自訂工作流程。 IronOCR 支援多種格式和多種語言作為輸入。
IronOCR 也提供了以下高級功能 เช่น條碼讀取,圖像處理,和文字提取,可以幫助開發人員創建更強大且高效的應用程式。 IronOCR 可以匯出到各種輸出格式,包括純文字、可搜尋的 PDF 和 Microsoft Word 文件。
若要在您的 C# 專案中使用 IronOCR,首先安裝 IronOCR NuGet 套件:
Install-Package IronOcr
安裝軟體包後,您可以使用以下範例代碼對圖像或掃描文件進行光學字符識別 (OCR):
using IronOcr;
var ocr = new IronTesseract();
using (var input = new OcrInput()) {
input.AddImage("attachment.png");
input.AddPdf("report.pdf");
OcrResult result = ocr.Read(input);
string text = result.Text;
}
using IronOcr;
var ocr = new IronTesseract();
using (var input = new OcrInput()) {
input.AddImage("attachment.png");
input.AddPdf("report.pdf");
OcrResult result = ocr.Read(input);
string text = result.Text;
}
Imports IronOcr
Private ocr = New IronTesseract()
Using input = New OcrInput()
input.AddImage("attachment.png")
input.AddPdf("report.pdf")
Dim result As OcrResult = ocr.Read(input)
Dim text As String = result.Text
End Using
程式碼的第一行導入了 IronOcr
命名空間,其中包含了執行光學字符識別 (OCR) 所需的類和方法。
接下來,創建一個新的 IronTesseract 類別實例並將其存儲在變數 ocr
中。 IronTesseract
是一個提供高級 OCR 功能的類別,包括對多線程和自動影像校正的支援。
接下來使用 using
語句來建立 OcrInput
類別的新實例,該類別用於定義 OCR 過程的輸入。 在 using 區塊內,透過 AddImage
和 AddPdf
方法將兩個檔案新增至輸入物件。 這些文件分別是"attachment.png"和"report.pdf"。
在添加文件後,會在 IronTesseract
物件上調用 Read
方法,並將 OcrInput
物件作為參數傳遞。 此方法對輸入檔案執行 OCR 過程並返回一個 OcrResult
對象,其中包含 OCR 輸出。
最後,OCR 輸出從 OcrResult
物件中提取並存儲在 "text" 變數中,這是一個包含從輸入檔案中提取文本的字串。 您可以使用IronOCR庫提供的豐富功能,進一步自訂OCR流程並操作結果。
選擇適合 Windows 10 的最佳 OCR 軟體取決於您的具體需求、預算和技術專業知識。ABBYY FineReader、Adobe Acrobat Pro DC 和 Readiris 都是尋找獨立 OCR 應用程式的大型公司優秀的選擇。 然而,如果您需要一個強大的 OCR 庫來無縫整合您的 C# 和 .NET 專案,IronOCR 是完美的選擇。