OCR 工具 Microsoft OCR 工具(C# 替代方案) Kannapat Udonpant 更新:6月 22, 2025 下載 IronOCR NuGet 下載 DLL 下載 Windows 安裝程式 開始免費試用 法學碩士副本 法學碩士副本 將頁面複製為 Markdown 格式,用於 LLMs 在 ChatGPT 中打開 請向 ChatGPT 諮詢此頁面 在雙子座打開 請向 Gemini 詢問此頁面 在雙子座打開 請向 Gemini 詢問此頁面 打開困惑 向 Perplexity 詢問有關此頁面的信息 分享 在 Facebook 上分享 分享到 X(Twitter) 在 LinkedIn 上分享 複製連結 電子郵件文章 OCR(光學字元辨識)對於各種規模的企業來說都是一項至關重要的技術。 它可以有效率地掃描、儲存和分析數據,而這些數據如果處理起來則既耗時又複雜。 微軟 OCR 工具提供強大的功能,可簡化您的數位轉型流程。 這些工具可實現更快、更有效率的文件處理,讓您有更多時間專注於發展業務這項重要任務。 在本文中,我們將探討如何利用強大的微軟 OCR 工具來簡化您的營運。 OneNote:微軟工具 如果您需要從圖像中提取文本,Microsoft OneNote 是一個很有用的工具。 OneNote 是一款功能全面的筆記應用程序,它提供了一個平台,用於捕獲、儲存和組織各種形式的信息,例如文字、圖像、音訊和視訊。 它還是一款非常實用的工具,可以從圖像或文件列印輸出中複製文本,無需手動輸入文本,從而節省您的時間和精力。 使用 OneNote 提取文本 要使用 OneNote 從圖像中提取文本,請按照以下步驟操作: 啟動 OneNote 應用程式。 使用"插入"選項插入影像文件,或直接將影像檔案拖曳到 OneNote 視窗中。 OneNote 插入功能區 右鍵單擊圖像,然後從選單中選擇"從圖片複製文字"。 在上下文選單中複製圖片中的文本 最後,將複製的文字貼上到任何所需位置,即可存取從掃描圖像中提取的文字。 文本來源於從圖像中複製的文本 這就是使用 OneNote 掃描任何圖像的方法。 Microsoft Vision Studio 微軟認知服務提供"從圖像中提取文字"功能,利用人工智慧掃描圖像並準確檢測文字。 這項服務操作簡便,只需上傳圖片或PDF檔案即可。系統隨後會將資訊高精確度轉錄,確保擷取的文字能夠準確反映圖片或PDF檔案的內容。 此外,擷取的文字可以是多種語言,使世界各地的使用者都能使用該服務。 借助微軟認知服務的"從圖像中提取文字"功能,從圖像中提取有價值的數據變得簡單,從而能夠進行高效的分析並有效完成任務。 使用 Microsoft Vision Studio 提取文本 若要使用"從圖片中擷取文字"功能,您可以造訪 Microsoft Azure 的Vision Studio 網站。 但是,這項服務需要訂閱 Azure。 訂閱購買後,您即可存取從掃描文件中提取的文字。 以下是輸出範例影像,供您參考。 掃描圖像以獲取其文字 A9T9 微軟免費 OCR 軟體 A9T9 免費 OCR 軟體是一款功能強大的工具,可讓 Windows 使用者輕鬆地將紙本文件轉換為數位文字。 它簡單易用的拖放功能可以立即識別多種語言的文本,包括英語、德語、中文、韓語和印度語。 該軟體可以從掃描影像或 PDF 文件中提取數據,並將其轉換為可編輯、可搜尋的格式。 該軟體支援多種輸出格式,例如富文本、TXT 或 CSV,以及圖像格式,例如 BMP、TIF 或 PDF。 它還具有自動文件傾斜校正功能。 這款軟體能夠快速且準確地識別各種語言圖像中的文本,即使是透明背景的圖像也能辨識。 A9T9 具有高精度、價格實惠、易於安裝等優點,是 Windows 用戶尋找免費 OCR 軟體解決方案的首選。 使用 A9T9 複製文本 您可以從微軟商店下載 A9T9 軟體。 安裝完成後,打開 A9T9 軟體並上傳圖像或 PDF 檔案。 使用 A9T9 複製文本 圖像或文件載入完成後,點擊"開始 OCR"按鈕。 這將從掃描的文檔或圖像中提取文本,並將其顯示在右側的文本區域中。 文字顯示在右側。 您可以選擇 OCR 語言,然後複製文字或將其儲存為 Word 文件。 辦公鏡頭 Office Lens 是一款功能強大的工具,專為捕捉和整理筆記、白板、菜單、標誌以及其他類型的書面或視覺訊息而設計。 這款應用程式提供了一種比傳統筆記方式更優越的替代方案,它消除了手寫筆記的需要,也避免了失去重要資訊的可能性。 Office Lens 使用戶能夠輕鬆捕捉草圖、手寫筆記、繪圖和方程式,並校正影像中的陰影和傾斜角度,以提高清晰度。 它還具備 OCR(光學字元辨識)功能,使用戶能夠數位化和編輯影像中的文字。 可惜的是,微軟已經停止了Windows版Office Lens的開發。 目前僅可在行動裝置上使用。 此外,Microsoft Word 2010 移除了 Microsoft Office 文件影像功能。 IronOCR:C# OCR庫 IronOCR 是一個功能強大的 C# OCR 函式庫,適用於 .NET 開發人員。 它能夠對掃描的文件和影像進行完整的 OCR 功能,使開發人員能夠輕鬆地實現基於文件的工作流程自動化。 IronOCR 擁有簡單的 API 和最少的配置,可輕鬆整合到現有系統中。 該庫提供了一個簡單的 API,只需極少的配置即可輕鬆整合到現有系統中。 它支援多種輸入檔案格式,包括 JPEG、TIFF、GIF、BMP、PDF、多頁 TIFF 和多重文件掃描,並且可以讀取不同方向影像中的文字。 IronOCR 的高級功能包括降噪,這有助於減少影像失真並提高文字擷取結果的準確性。 該庫支援超過 125 種語言,包括英語、法語、德語、西班牙語和日語,幾乎適用於任何需要高品質 OCR 結果而無需人工幹預的應用。 使用 IronOCR 提取文本 由於能夠輕鬆地從 PDF 文件中提取文本,因此可以指定特定的頁碼或從文件的所有頁面中提取文本。 使用合適的工具可以簡化流程,提高效率。 using IronOcr; using System; var ocrTesseract = new IronTesseract(); using (var ocrInput = new OcrInput()) { // Add the entire PDF for OCR processing ocrInput.AddPdf("example.pdf"); // Alternatively, OCR selected page numbers from a password-protected PDF ocrInput.AddPdfPages("example.pdf", new [] { 1, 2, 3 }, "password"); // Perform OCR and get the result var ocrResult = ocrTesseract.Read(ocrInput); // Output the extracted text Console.WriteLine(ocrResult.Text); } using IronOcr; using System; var ocrTesseract = new IronTesseract(); using (var ocrInput = new OcrInput()) { // Add the entire PDF for OCR processing ocrInput.AddPdf("example.pdf"); // Alternatively, OCR selected page numbers from a password-protected PDF ocrInput.AddPdfPages("example.pdf", new [] { 1, 2, 3 }, "password"); // Perform OCR and get the result var ocrResult = ocrTesseract.Read(ocrInput); // Output the extracted text Console.WriteLine(ocrResult.Text); } Imports IronOcr Imports System Private ocrTesseract = New IronTesseract() Using ocrInput As New OcrInput() ' Add the entire PDF for OCR processing ocrInput.AddPdf("example.pdf") ' Alternatively, OCR selected page numbers from a password-protected PDF ocrInput.AddPdfPages("example.pdf", { 1, 2, 3 }, "password") ' Perform OCR and get the result Dim ocrResult = ocrTesseract.Read(ocrInput) ' Output the extracted text Console.WriteLine(ocrResult.Text) End Using $vbLabelText $csharpLabel 以下是輸出結果: Visual Studio 偵錯控制台中的輸出 除了從 PDF 文件中提取文字外,您還可以輕鬆讀取條碼。 該庫提供了一個簡單的程式碼實作來讀取條碼,使其成為各種基於文件的工作流程的多功能工具。 請看以下程式碼: using IronOcr; using System; var ocrTesseract = new IronTesseract(); ocrTesseract.Configuration.ReadBarCodes = true; // Read barcodes from an image file using (var ocrInput = new OcrInput(@"images\imageWithBarcode.png")) { var ocrResult = ocrTesseract.Read(ocrInput); // Iterate through the detected barcodes and print their values foreach (var barcode in ocrResult.Barcodes) { Console.WriteLine(barcode.Value); } } using IronOcr; using System; var ocrTesseract = new IronTesseract(); ocrTesseract.Configuration.ReadBarCodes = true; // Read barcodes from an image file using (var ocrInput = new OcrInput(@"images\imageWithBarcode.png")) { var ocrResult = ocrTesseract.Read(ocrInput); // Iterate through the detected barcodes and print their values foreach (var barcode in ocrResult.Barcodes) { Console.WriteLine(barcode.Value); } } Imports IronOcr Imports System Private ocrTesseract = New IronTesseract() ocrTesseract.Configuration.ReadBarCodes = True ' Read barcodes from an image file Using ocrInput As New OcrInput("images\imageWithBarcode.png") Dim ocrResult = ocrTesseract.Read(ocrInput) ' Iterate through the detected barcodes and print their values For Each barcode In ocrResult.Barcodes Console.WriteLine(barcode.Value) Next barcode End Using $vbLabelText $csharpLabel 程式碼的輸入/輸出 IronOCR 能夠支援低 DPI 和雜訊影像,方法是在處理前對其進行增強。 using IronOcr; using System; var ocrTesseract = new IronTesseract(); // Process a noisy image by deskewing and denoising it using (var ocrInput = new OcrInput(@"images\image.png")) { ocrInput.Deskew(); // Corrects for skewness in the image ocrInput.DeNoise(); // Reduces visual noise for better recognition // Perform OCR and print the text var ocrResult = ocrTesseract.Read(ocrInput); Console.WriteLine(ocrResult.Text); } using IronOcr; using System; var ocrTesseract = new IronTesseract(); // Process a noisy image by deskewing and denoising it using (var ocrInput = new OcrInput(@"images\image.png")) { ocrInput.Deskew(); // Corrects for skewness in the image ocrInput.DeNoise(); // Reduces visual noise for better recognition // Perform OCR and print the text var ocrResult = ocrTesseract.Read(ocrInput); Console.WriteLine(ocrResult.Text); } Imports IronOcr Imports System Private ocrTesseract = New IronTesseract() ' Process a noisy image by deskewing and denoising it Using ocrInput As New OcrInput("images\image.png") ocrInput.Deskew() ' Corrects for skewness in the image ocrInput.DeNoise() ' Reduces visual noise for better recognition ' Perform OCR and print the text Dim ocrResult = ocrTesseract.Read(ocrInput) Console.WriteLine(ocrResult.Text) End Using $vbLabelText $csharpLabel 結論 總而言之,光學字元辨識 (OCR) 是一項至關重要的工具,可以極大地造福各種規模的企業,使他們能夠高效地掃描、存儲和處理信息,而這些信息如果手動管理則會既複雜又耗時。 微軟提供各種 OCR 工具,包括 OneNote、Microsoft Vision Studio 和 A9T9 免費 OCR 軟體,這些工具可簡化流程並節省時間。 IronOCR 是一款功能齊全的 OCR 庫,在眾多 OCR 工具中脫穎而出。 它可輕鬆與 C# 和 VB.NET 應用程式集成,提供出色的準確性,可識別多種語言和圖像格式,並提供免費試用期,授權費用從$799起。 對於尋求提升數位轉型能力的企業而言,IronOCR 是一項極具價值的投資。 這些 OCR 工具各具特色,能夠滿足不同的需求,因此對於希望改善數位轉型的企業來說,它們是寶貴的資產。 Kannapat Udonpant 立即與工程團隊聊天 軟體工程師 在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。 相關文章 更新6月 22, 2025 Power Automate OCR 開發者教學 這項光學字符識別技術應用於文件數字化、自動化 PDF 數據提取和輸入、發票處理和使掃描的 PDF 可搜尋。 閱讀更多 更新6月 22, 2025 Easyocr vs Tesseract(OCR 功能比較) 流行的 OCR 工具和函式庫,像 EasyOCR,Tesseract OCR,Keras-OCR 和 IronOCR,被普遍用於將此功能集成到現代應用中。 閱讀更多 更新6月 22, 2025 如何將圖片轉換為文本 在當前的數位時代,將基於影像的內容轉換為易於閱讀的可編輯、可搜尋的文本 閱讀更多 Windows 10 的最佳 OCR 軟體(比較列表)安裝 Tesseract(逐步圖片教學)
更新6月 22, 2025 Easyocr vs Tesseract(OCR 功能比較) 流行的 OCR 工具和函式庫,像 EasyOCR,Tesseract OCR,Keras-OCR 和 IronOCR,被普遍用於將此功能集成到現代應用中。 閱讀更多