如何使用IronOCR辨識手寫影像:圖片轉文字與 OCR辨識指南
IronOCR提供了一種專門的 ReadHandwriting 方法,可以可靠地執行圖片轉文字,將圖像中的手寫文字數位化,儘管存在不規則間距和筆畫變化等固有挑戰,但 OCR辨識準確率仍可達 90% 左右。
快速入門:使用IronOCR讀取手寫圖像
- 安裝IronOCR和IronOCR軟體包
- 建立一個
IronTesseract實例 - 使用
LoadImage()載入您的手寫圖像 - 呼叫
ReadHandwriting()方法 - 從
OcrResult中存取提取的文本
-
使用NuGet套件管理器安裝https://www.nuget.org/packages/IronOcr
PM > Install-Package IronOcr -
複製並運行這段程式碼。
using IronOcr; var ocrTesseract = new IronTesseract(); using var ocrInput = new OcrInput(); ocrInput.LoadImage("handwriting.png"); var ocrResult = ocrTesseract.ReadHandwriting(ocrInput); Console.WriteLine(ocrResult.Text); -
部署到您的生產環境進行測試
今天就在您的專案中開始使用免費試用IronOCR
自動從圖像中讀取手寫文字非常困難,因為每個人的書寫方式都不同。 這種巨大的不一致性使得OCR辨識充滿挑戰。 舊記錄、病人登記表和客戶調查等重要文件仍需要手動處理,導致工作流程容易出錯,進而損害資料完整性。
IronOCR透過引入一種專門的方法來可靠地理解和數位化手寫影像,從而解決了這個問題。 IronOCR基於強大的Tesseract 5 引擎,將先進的影像處理與機器學習相結合,提供業界領先的手寫辨識功能。
本指南將逐步指導您如何在.NET應用程式中實現手寫 OCR 功能。無論您是數位化歷史文件、處理醫療表格還是轉換手寫筆記,您都將學習如何使用IronOCR獲得可靠的識別結果。
IronOCR入門指南
如何使用IronOCR辨識手寫影像
- 下載用於讀取手寫圖像的 C# 庫
- 實例化 OCR 引擎
- 使用`LoadImage`載入手寫圖像
- 使用`ReadHandwriting`方法從樣本手寫圖像中提取數據
- 存取**OcrResult**屬性以查看和操作提取的數據
若要使用此功能,您必須先安裝IronOCR軟體套件。 請注意,ReadHandwriting 方法目前僅支援英文。 對於多語言 OCR ,請使用標準 Read() 方法以及對應的語言套件。
如何使用IronOCR讀取手寫影像?
使用IronOCR讀取手寫影像非常簡單。 首先實例化 OCR 引擎,然後使用 LoadImage 載入圖片,最後使用專為手寫辨識設計的 ReadHandwriting 方法。 列印提取的文字以驗證其準確性和內容。
處理影像前,可考慮套用影像品質校正濾鏡以提高影像清晰度。 這些過濾器可以顯著提高識別準確率,尤其適用於對比度或解析度較差的掃描文件。
我應該使用哪種輸入格式?
:path=/static-assets/ocr/content-code-examples/how-to/read-handwritten-image.cs
using IronOcr;
using System;
// Instantiate OCR engine
var ocr = new IronTesseract();
// Load handwriting image
var inputHandWriting = new OcrInput();
inputHandWriting.LoadImage("handwritten.png");
// Perform OCR on the handwriting image
OcrHandwritingResult result = ocr.ReadHandwriting(inputHandWriting);
// Output the recognized handwritten text
Console.WriteLine(result.Text);
// Output the confidence score of the OCR result
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
' Instantiate OCR engine
Dim ocr As New IronTesseract()
' Load handwriting image
Dim inputHandWriting As New OcrInput()
inputHandWriting.LoadImage("handwritten.png")
' Perform OCR on the handwriting image
Dim result As OcrHandwritingResult = ocr.ReadHandwriting(inputHandWriting)
' Output the recognized handwritten text
Console.WriteLine(result.Text)
' Output the confidence score of the OCR result
Console.WriteLine(result.Confidence)
我可以期待什麼樣的結果?
ReadHandwriting 方法的置信度得分達到 90.6%,正確識別了大部分文本,包括開頭短語"我的名字是艾琳·菲什"。
這一優異的結果證明了 IronOCR 在識別複雜手寫字體方面的能力。 雖然引擎在處理空格和連寫字母時遇到了困難,但它成功提取了核心訊息。 這顯示IronOCR能有效處理複雜的、非標準的文本。
對於 OCR 新手來說,可以先從我們簡單的 OCR 教學入手,了解基礎知識,然後再學習手寫辨識。
如何使用非同步版本?
IronOCR支援非同步版本:ReadHandwritingAsync。 這在處理需要先取得輸入影像再處理的非同步程式碼時非常有用。 非同步支援文件提供了有關實現非同步 OCR 操作的全面指導。
使用相同的輸入,以下是如何使用非同步方法:
:path=/static-assets/ocr/content-code-examples/how-to/read-handwritten-image-async.cs
using IronOcr;
using System;
using System.Threading.Tasks;
using System;
using System.Threading.Tasks;
#endregion
public class read_handwritten_image_async
{
public async Task codeAsync()
{
// Instantiate OCR engine
var ocr = new IronTesseract();
// Load handwriting image
var inputHandWriting = new OcrInput();
inputHandWriting.LoadImage("handwritten.png");
// Perform OCR using the async method with 'await'.
// The compiler automatically infers this top-level code block as an 'async Task Main()' method.
OcrHandwritingResult result = await ocr.ReadHandwritingAsync(inputHandWriting);
// Output the recognized handwriting text
Console.WriteLine(result.Text);
// Output the confidence score of the OCR result
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Threading.Tasks
Public Class ReadHandwrittenImageAsync
Public Async Function CodeAsync() As Task
' Instantiate OCR engine
Dim ocr As New IronTesseract()
' Load handwriting image
Dim inputHandWriting As New OcrInput()
inputHandWriting.LoadImage("handwritten.png")
' Perform OCR using the async method with 'Await'.
' The compiler automatically infers this top-level code block as an 'async Task Main()' method.
Dim result As OcrHandwritingResult = Await ocr.ReadHandwritingAsync(inputHandWriting)
' Output the recognized handwriting text
Console.WriteLine(result.Text)
' Output the confidence score of the OCR result
Console.WriteLine(result.Confidence)
End Function
End Class
您可以提供一個可選的 timeoutMs 參數來指定自動取消前的毫秒數。 預設值為 -1,表示沒有時間限制-操作將一直運行直到完成。
高級加工技術
對於複雜的筆跡辨識場景,可以考慮以下進階技術:
區域特定 OCR :處理表單或結構化文件時,使用基於區域的 OCR來專注於包含手寫文字的特定區域。 這種方法透過限制處理區域來提高精度:
using IronOcr;
using IronSoftware.Drawing;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Define a specific region for signature area
var signatureRegion = new CropRectangle(x: 100, y: 500, width: 300, height: 100);
ocrInput.LoadImage("form-with-signature.png", signatureRegion);
var signatureResult = ocrTesseract.ReadHandwriting(ocrInput);
Console.WriteLine($"Signature text: {signatureResult.Text}");
using IronOcr;
using IronSoftware.Drawing;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Define a specific region for signature area
var signatureRegion = new CropRectangle(x: 100, y: 500, width: 300, height: 100);
ocrInput.LoadImage("form-with-signature.png", signatureRegion);
var signatureResult = ocrTesseract.ReadHandwriting(ocrInput);
Console.WriteLine($"Signature text: {signatureResult.Text}");
Imports IronOcr
Imports IronSoftware.Drawing
Dim ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput()
' Define a specific region for signature area
Dim signatureRegion As New CropRectangle(x:=100, y:=500, width:=300, height:=100)
ocrInput.LoadImage("form-with-signature.png", signatureRegion)
Dim signatureResult = ocrTesseract.ReadHandwriting(ocrInput)
Console.WriteLine($"Signature text: {signatureResult.Text}")
End Using
進度追蹤:對於批次處理多個手寫文檔,實施進度追蹤以監控 OCR 操作:
ocrTesseract.OcrProgress += (sender, e) =>
{
Console.WriteLine($"Processing: {e.ProgressPercent}% complete");
};
ocrTesseract.OcrProgress += (sender, e) =>
{
Console.WriteLine($"Processing: {e.ProgressPercent}% complete");
};
ocrTesseract.OcrProgress += Sub(sender, e)
Console.WriteLine($"Processing: {e.ProgressPercent}% complete")
End Sub
我該注意哪些挑戰?
儘管IronOCR在保留整體結構和文字方面取得了很高的準確率,但 OCR 在處理手寫文字時仍然存在困難,導致局部錯誤。 常見挑戰需要對提取的輸出進行驗證:
不規則間距:印刷文本中字母之間的間距均勻。 手寫體筆畫間距和字母連接間距差異很大。 這會導致字元分割錯誤,如 ununiformed 被分割成單字元(非單一焦點)而不是單字時所示。
筆畫差異:每個人的筆跡都獨一無二,即使是同一個字母,每次書寫的方式也會有所不同。字母的連接方式和模式也存在顯著差異。 這就避免了"一刀切"的模式,因為引擎必須處理衝程傾斜度、壓力和形狀的高度變化,使得模式匹配不如使用標準化字體可靠。
字形模糊:手寫體通常筆畫簡化或匆忙,導致字形模糊。例如,快速書寫的 e 可能類似於 c,或連接在一起的 l 和 i 也可能被誤認。
品質和解析度問題:掃描品質差、解析度低或墨跡褪色會嚴重影響辨識準確度。 遇到此類問題時,請參考我們的通用故障排除指南以取得解決方案。
使用此方法時,請檢查輸出是否與預期輸入相符,尤其要注意間距過近或拼字錯誤的單字。 考慮實現後處理邏輯來處理您用例中常見的錯誤識別。
ReadHandwriting 方法在處理草書時只能實現低準確度的 OCR 萃取。 常見問題解答
從影像中萃取手寫文字的精確度為何?
IronOCR 的 ReadHandwriting 方法在英文手寫辨識上達到約 90% 的準確度,儘管不規則的間距和筆劃變化是手寫 OCR 特別困難的固有挑戰。
手寫辨識支援哪些語言?
IronOCR 中的 ReadHandwriting 方法目前僅支援英文。對於多國語言的 OCR,您需要使用標準的 Read() 方法與適當的語言套件,而非專門的手寫方法。
手寫 OCR 需要安裝哪些額外套件?
若要使用 IronOCR 中的手寫辨識功能,除了 IronOCR 主程式庫之外,您必須安裝 IronOcr.Extensions.AdvancedScan 套件。
如何在 C# 中實現基本的手寫辨識功能?
建立 IronTesseract 範例,使用 LoadImage() 載入您的手寫圖像,呼叫 ReadHandwriting() 方法,並從 OcrResult 存取擷取的文字。IronOCR 會自動處理複雜的影像處理和機器學習。
可以處理哪些類型的手寫文件?
IronOCR 可處理各種手寫文件,包括歷史記錄、病人入院表、客戶調查問卷和手寫筆記。這個函式庫的設計是為了處理人類手寫筆跡不一致的問題,這些問題使得手寫處理容易出錯。
手寫辨識功能採用什麼技術?
IronOCR 的手寫辨識功能建構在強大的 Tesseract 5 引擎上,結合先進的影像處理與機器學習演算法,提供領先業界的手寫辨識能力。

