如何使用 IronOCR 辨識手寫影像

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR 提供了一種專門的ReadHandwriting方法,可以可靠地將圖像中的手寫文字數位化,儘管存在不規則間距和筆畫變化等固有挑戰,但對於英文手寫體仍能達到約 90% 的準確率。

快速入門:使用 IronOCR 讀取手寫影像

  1. 安裝 IronOCR 和 IronOcr.Extensions.AdvancedScan 軟體包
  2. 建立一個IronTesseract實例
  3. 使用LoadImage()載入您的手寫影像
  4. 呼叫ReadHandwriting()方法
  5. OcrResult存取提取的文本

Nuget Icon立即開始使用 NuGet 建立 PDF 檔案:

  1. 使用 NuGet 套件管理器安裝 IronOCR

    PM > Install-Package IronOcr

  2. 複製並運行這段程式碼。

    using IronOcr;
    
    var ocrTesseract = new IronTesseract();
    using var ocrInput = new OcrInput();
    ocrInput.LoadImage("handwriting.png");
    var ocrResult = ocrTesseract.ReadHandwriting(ocrInput);
    Console.WriteLine(ocrResult.Text);
  3. 部署到您的生產環境進行測試

    立即開始在您的專案中使用 IronOCR,免費試用!
    arrow pointer

自動從圖像中讀取手寫文字非常困難,因為每個人的書寫方式都不同。 這種巨大的不一致性使得OCR辨識充滿挑戰。 舊記錄、病人登記表和客戶調查等重要文件仍需要手動處理,導致工作流程容易出錯,進而損害資料完整性。

IronOCR 透過引入一種專門的方法來可靠地理解和數位化手寫影像,從而解決了這個問題。 IronOCR 基於強大的Tesseract 5 引擎,將先進的影像處理與機器學習相結合,提供業界領先的手寫辨識功能。

本指南將逐步指導您如何在 .NET 應用程式中實作手寫 OCR 功能。無論您是數位化歷史文件、處理醫療表格還是轉換手寫筆記,您都將學習如何使用 IronOCR 獲得可靠的識別結果。

IronOCR 入門指南


若要使用此功能,您必須先安裝IronOcr.Extensions.AdvancedScan軟體套件。 請注意, ReadHandwriting方法目前僅支援英文。 對於多語言 OCR ,請使用具有對應語言套件的標準Read()方法。

如何使用 IronOCR 辨識手寫影像?

使用 IronOCR 讀取手寫影像非常簡單。 首先實例化 OCR 引擎,然後使用LoadImage載入映像,最後使用專為手寫辨識設計的ReadHandwriting專門方法。 列印提取的文字以驗證其準確性和內容。

處理影像前,可考慮套用影像品質校正濾鏡以提高影像清晰度。 這些過濾器可以顯著提高識別準確率,尤其適用於對比度或解析度較差的掃描文件。

我應該使用哪種輸入格式?

範例手寫輸入影像,顯示用於 OCR 處理的草寫文本
:path=/static-assets/ocr/content-code-examples/how-to/read-handwritten-image.cs
using IronOcr;

// Instantiate OCR engine
var ocr = new IronTesseract();

// Load handwriting image
var inputHandWriting = new OcrInput();
inputHandWriting.LoadImage("handwritten.png");

// Perform OCR on the handwriting image
OcrHandwritingResult result = ocr.ReadHandwriting(inputHandWriting);

// Output the recognized handwritten text
Console.WriteLine(result.Text);
// Output the confidence score of the OCR result
Console.WriteLine(result.Confidence);
$vbLabelText   $csharpLabel

我可以期待什麼樣的結果?

OCR 輸出結果顯示提取的手寫文字及其置信度得分

ReadHandwriting方法的置信度達到了 90.6%,正確識別了大部分文本,包括開頭短語"我的名字是艾琳·菲什"。

這一優異的結果證明了 IronOCR 在識別複雜手寫字體方面的能力。 雖然引擎在處理空格和連寫字母時遇到了困難,但它成功提取了核心訊息。 這顯示 IronOCR 能有效處理複雜的、非標準的文字。

對於 OCR 新手來說,可以先從我們簡單的 OCR 教學入手,了解基礎知識,然後再學習手寫辨識。

如何使用非同步版本?

IronOCR 支援非同步版本: ReadHandwritingAsync 。 這在處理需要先取得輸入影像再處理的非同步程式碼時非常有用。 非同步支援文件提供了有關實現非同步 OCR 操作的全面指導。

使用相同的輸入,以下是如何使用非同步方法:

:path=/static-assets/ocr/content-code-examples/how-to/read-handwritten-image-async.cs
using IronOcr;
using System.Threading.Tasks;

// Instantiate OCR engine
var ocr = new IronTesseract();

// Load handwriting image
var inputHandWriting = new OcrInput();
inputHandWriting.LoadImage("handwritten.png");

// Perform OCR using the async method with 'await'.
// The compiler automatically infers this top-level code block as an 'async Task Main()' method.
OcrHandwritingResult result = await ocr.ReadHandwritingAsync(inputHandWriting);

// Output the recognized handwriting text
Console.WriteLine(result.Text);
// Output the confidence score of the OCR result
Console.WriteLine(result.Confidence);
$vbLabelText   $csharpLabel

您可以提供一個可選的timeoutMs參數,用於指定自動取消前的毫秒數。 預設值為-1 ,表示沒有時間限制-操作將一直運行直到完成。

高級加工技術

對於複雜的筆跡辨識場景,可以考慮以下進階技術:

區域特定 OCR :處理表單或結構化文件時,使用基於區域的 OCR來專注於包含手寫文字的特定區域。 這種方法透過限制處理區域來提高精度:

using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Define a specific region for signature area
var signatureRegion = new CropRectangle(x: 100, y: 500, width: 300, height: 100);
ocrInput.LoadImage("form-with-signature.png", signatureRegion);

var signatureResult = ocrTesseract.ReadHandwriting(ocrInput);
Console.WriteLine($"Signature text: {signatureResult.Text}");
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Define a specific region for signature area
var signatureRegion = new CropRectangle(x: 100, y: 500, width: 300, height: 100);
ocrInput.LoadImage("form-with-signature.png", signatureRegion);

var signatureResult = ocrTesseract.ReadHandwriting(ocrInput);
Console.WriteLine($"Signature text: {signatureResult.Text}");
$vbLabelText   $csharpLabel

進度追蹤:對於批次處理多個手寫文檔,實施進度追蹤以監控 OCR 操作:

ocrTesseract.OcrProgress += (sender, e) => 
{
    Console.WriteLine($"Processing: {e.ProgressPercent}% complete");
};
ocrTesseract.OcrProgress += (sender, e) => 
{
    Console.WriteLine($"Processing: {e.ProgressPercent}% complete");
};
$vbLabelText   $csharpLabel

我該注意哪些挑戰?

儘管 IronOCR 在保留整體結構和文字方面取得了很高的準確率,但 OCR 在處理手寫文字時仍然存在困難,導致局部錯誤。 常見挑戰需要對提取的輸出進行驗證:

不規則間距:印刷文本中字母之間的間距均勻。 手寫體筆畫間距和字母連接間距差異很大。 這會導致字元分割錯誤,如 ununifocmed 被分割成ununiformed字元而不是單字時所示。

筆畫差異:每個人的筆跡都獨一無二,即使是同一個字母,每次書寫的方式也會有所不同。字母的連接方式和模式也存在顯著差異。 這就避免了"一刀切"的模式,因為引擎必須處理衝程傾斜度、壓力和形狀的高度變化,使得模式匹配不如使用標準化字體可靠。

字形歧義:手寫體經常使用簡化的筆畫或匆忙的筆畫,從而產生字形歧義。例如,快速書寫的e可能看起來像c ,或連在一起的li可能被誤認。

品質和解析度問題:掃描品質差、解析度低或墨跡褪色會嚴重影響辨識準確度。 遇到此類問題時,請參考我們的通用故障排除指南以取得解決方案。

使用此方法時,請檢查輸出是否與預期輸入相符,尤其要注意間距過近或拼字錯誤的單字。 考慮實現後處理邏輯來處理您用例中常見的錯誤識別。

[{w:( ReadHandwriting方法在辨識草書時只能實現較低的 OCR 提取準確率。 @@--括號關閉--@@

常見問題解答

從影像中萃取手寫文字的精確度為何?

IronOCR 的 ReadHandwriting 方法在英文手寫辨識上達到約 90% 的準確度,儘管不規則的間距和筆劃變化是手寫 OCR 特別困難的固有挑戰。

手寫辨識支援哪些語言?

IronOCR 中的 ReadHandwriting 方法目前僅支援英文。對於多國語言的 OCR,您需要使用標準的 Read() 方法與適當的語言套件,而非專門的手寫方法。

手寫 OCR 需要安裝哪些額外套件?

若要使用 IronOCR 中的手寫辨識功能,除了 IronOCR 主程式庫之外,您必須安裝 IronOcr.Extensions.AdvancedScan 套件。

如何在 C# 中實現基本的手寫辨識功能?

建立 IronTesseract 範例,使用 LoadImage() 載入您的手寫圖像,呼叫 ReadHandwriting() 方法,並從 OcrResult 存取擷取的文字。IronOCR 會自動處理複雜的影像處理和機器學習。

可以處理哪些類型的手寫文件?

IronOCR 可處理各種手寫文件,包括歷史記錄、病人入院表、客戶調查問卷和手寫筆記。這個函式庫的設計是為了處理人類手寫筆跡不一致的問題,這些問題使得手寫處理容易出錯。

手寫辨識功能採用什麼技術?

IronOCR 的手寫辨識功能建構在強大的 Tesseract 5 引擎上,結合先進的影像處理與機器學習演算法,提供領先業界的手寫辨識能力。

柯蒂斯·週
技術撰稿人

Curtis Chau擁有卡爾頓大學電腦科學學士學位,專長於前端開發,精通Node.js、TypeScript、JavaScript和React。他熱衷於打造直覺美觀的使用者介面,喜歡使用現代框架,並擅長撰寫結構清晰、視覺效果出色的使用者手冊。

除了開發工作之外,柯蒂斯對物聯網 (IoT) 也抱有濃厚的興趣,致力於探索硬體和軟體整合的創新方法。閒暇時,他喜歡玩遊戲和製作 Discord 機器人,將他對科技的熱愛與創造力結合。

準備好開始了嗎?
Nuget 下載 5,299,091 | 版本: 2025.12 剛剛發布