跳過到頁腳內容
OCR 工具
如何在 Windows 11 上使用 C# 的 OCR

Windows 11 中的 OCR(免費線上工具)

光學字元辨識(OCR)將掃描的文本影像轉換為標準文本,以便在文件分析中進行編輯。 該程式透過字元的形狀、大小和分佈來識別字元。 它將這些與已知的字元形狀和分佈進行比較,以識別字元。 OCR軟體可以將文件從一種文件格式轉換為另一種可能使用不同底層OCR技術的格式。 OCR 可將任何文件中的文字轉換為機器可讀的文字格式,從而輸出可編輯的文件。

OCR 的日常用途包括將紙本文件轉換為 PDF 或可搜尋的文字文件,例如,用於存檔或在電子閱讀器等行動裝置上查看。 潛在應用範圍非常廣泛——例如掃描紙本文件以便進行數位閱讀; 將檔案館的記錄數位化; 將紙本書和雜誌轉換為電子書; 即使是那些因時間久遠而無法辨認的舊證據,也能用於破案。本文將探討如何在 Windows 11 中進行 OCR 辨識。

圖片掃描:免費OCR軟體

Photo Scan 是一款適用於 Windows 11 的免費 OCR 軟體,可從 Microsoft Store 免費下載。它內建光學字元辨識技術,無需任何第三方軟體整合即可從圖像檔案中提取文字。

它允許您透過選擇檔案、拖放檔案或從剪貼簿選擇影像來使用電腦中的照片。 您只需單擊滑鼠即可提取文字。 可以輕鬆從微軟商店下載。

Ocr In Windows 11 1 related to 圖片掃描:免費OCR軟體

以下是如何使用照片掃描應用程式執行 OCR 操作的方法:

  • 在 Windows 11 中開啟照片掃描應用程式。
  • 開啟軟體後,您將看到獲取影像的三種選項:
    • 瀏覽照片
    • 使用相機
    • 來自剪貼簿
  • 使用上述任何一種方法,並將圖片上傳到照片掃描應用程式。
  • 圖片上傳後,您將在應用程式的右側看到提取的文字。

您也可以使用線上版 Adobe Acrobat Reader 對 PDF 文件進行 OCR 識別。

線上OCR工具

我們已經了解如何在本機 Windows 機器上使用光學字元辨識軟體來實現這一點。 讓我們來探討一下如何在線上完成這項工作。我們將介紹一些目前最好的免費OCR軟體。

DocSumo OCR 工具

DocSumo 線上 OCR 掃描器對於需要將掃描文件轉換為 PDF、文字和 Microsoft Word 等不同格式的使用者來說是一個有用的工具。 對於想要閱讀舊印刷或手寫文件的人來說,它也很有幫助。 讓我們看看如何使用 DocSumo OCR 工具從圖像檔案或 pdf 檔案中提取文字。

在任何支援的瀏覽器中開啟 DocSumo OCR 工具網站。

點擊"上傳文件",然後選擇任何受支援的文件格式的文件。 它可以是EPUB格式或任何PDF文件。 DocSumo支援幾乎所有包含視覺化資料的文件格式。

Ocr In Windows 11 2 related to DocSumo OCR 工具

文件上傳後,程式將開始處理並從掃描文件中提取文字。

Ocr In Windows 11 3 related to DocSumo OCR 工具

處理完成後,您將能夠下載提取出的文字檔案。您將獲得可編輯的文字檔案。

Ocr In Windows 11 4 related to DocSumo OCR 工具

所以,這就是我們使用 DocSumo OCR 工具來提取文字的方法。

OCRC轉換

OCRConvert是一款線上 OCR 工具,可將紙本文件轉換為數位文件。 它提供專業且價格合理的優質服務,滿足各種需求。 OCRConvert 是一個一站式平台,可幫助任何想要將舊資料數位化,並使其能夠逐字逐句地與世界各地的用戶進行存取、搜尋和共享的用戶。

該軟體採用光學字元辨識 (OCR) 技術從紙本文件的掃描影像中提取文本,使用戶能夠對文字格式方面進行廣泛的控制。 OCR轉換有助於消除人為錯誤,提高準確性,從而為公司的資訊管理策略帶來更多價值和透明度。

讓我們看看如何使用 OCRConvert 從掃描文件中提取文字。

造訪 OCRConvert 網站。

Ocr In Windows 11 5 related to OCRC轉換

點選"選擇檔案",選擇所需文件。選擇輸出類型,然後點選"轉換"按鈕。

Ocr In Windows 11 6 related to OCRC轉換

點擊後,它將開始從上傳的文件中提取文字。

點擊下載按鈕即可下載擷取的文字。

Ocr In Windows 11 7 related to OCRC轉換

To-text.net

To-text.net 是一款可以幫助您即時將 PDF 或影像轉換為可編輯文字的工具。它使內容編輯和轉換過程變得快速而簡單。

To-text.net 使用 AI 和自動 OCR(光學字元辨識)技術來識別文本,該技術可以檢測掃描文件上的文本並將其轉換為螢幕上的格式化文字。 該工具的優點在於可以快速將pdf文件轉換為可編輯文檔,而無需下載或發送到其他地方進行轉換。 對於任何想要處理大量資料的人來說,這也是一個絕佳的選擇,因為使用此應用程式不需要高端掃描器或任何軟體。

請依照以下步驟執行 OCR 操作:

開啟 To-text.net 網站。

  • 從裝置上傳所需文件。可以是圖片文件,也可以是PDF文件。
  • 之後,選擇輸出語言,然後點選"轉換"按鈕。 它將開始從掃描的 PDF 文件影像中提取資料。
Ocr In Windows 11 8 related to To-text.net

轉換完成後,您將在文字編輯器中看到輸出文本,並且可以下載該文字檔案。

IronOCR:C# 庫

IronOCR是一個針對 .NET 開發人員的熱門 OCR 函式庫。 它為成像、數位化和識別提供高精度、快速處理和即時性能。 自 2006 年以來,IronOCR 一直致力於提供一種簡單的影像資料處理方式。該庫是一個軟體元件,它透過自動掃描文件來簡化文件數位化過程。 它還支援其他流程,例如掃描影像的 OCR、文件索引和光學字元辨識 (OCR)。

IronOCR 庫是一個 C# API,可用於各種行業,包括行銷自動化、數位廣告、醫療保健 IT、公共事務和安全。 讓我們來看一個使用 IronOCR 庫的程式碼範例:

程式碼範例

using IronOCR;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add an image from which you want to extract text
    Input.AddImage("Image.jpg");
    // You can add any number of images
    var Result = Ocr.Read(Input);
    // Print extracted text to the console
    Console.WriteLine(Result.Text);
}
using IronOCR;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add an image from which you want to extract text
    Input.AddImage("Image.jpg");
    // You can add any number of images
    var Result = Ocr.Read(Input);
    // Print extracted text to the console
    Console.WriteLine(Result.Text);
}
Imports IronOCR

Private Ocr = New IronTesseract()
Using Input = New OcrInput()
	' Add an image from which you want to extract text
	Input.AddImage("Image.jpg")
	' You can add any number of images
	Dim Result = Ocr.Read(Input)
	' Print extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

輸入影像

Ocr In Windows 11 9 related to 輸入影像

輸出

Ocr In Windows 11 10 related to 輸出

授權

IronOCR 完全免費,可用於開發目的。 您可以利用其免費試用功能。 IronOCR 提供三種類型的許可選項,以適應不同規模的企業。 您可以選擇購買一名開發者、十名開發者或無限名開發者的授權。 Iron Software 也提供 5 款產品套裝,價格僅相當於兩款產品。 更多資訊請點擊此連結

Kannaopat Udonpant
軟體工程師
在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。