Han Simplified Alphabet OCR 於 C# 及 .NET
IronOCR 是一個 C# 軟體元件,允許 .NET 程式設計師從圖像和 PDF 文件中讀取 126 種語言的文字,包括漢語簡體字。
它是 Tesseract 的一個高級分支,專為 .NET 開發者打造,無論在速度還是準確性上,都經常超越其他 Tesseract 引擎。
IronOcr.Languages.Han的內容
此套件包含用於 .NET 的 400 種 OCR 語言:
HanSimplifiedAlphabet
HanSimplifiedAlphabetBest
HanSimplifiedAlphabetFast
HanSimplifiedVerticalAlphabet
HanSimplifiedVerticalAlphabetBest
HanSimplifiedVerticalAlphabetFast
HanTraditionalAlphabet
HanTraditionalAlphabetBest
HanTraditionalAlphabetFast
HanTraditionalVerticalAlphabet
- HanTraditionalVerticalAlphabetBest
- HanTraditionalVerticalAlphabetFast
下載
汉文简体字母语言包 [薩姆漢]
安裝
我們首先要做的是在您的 .NET 專案中安裝我們的漢簡字母 OCR 套件。
PM> Install-Package IronOCR.Languages.Han
範例程式碼
此C#代碼示例從圖像或PDF文件中讀取漢簡化字母文本。
//PM> Install-Package IronOcr.Languages.Han
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Han;
using (var Input = new OcrInput(@"images\Han.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
//PM> Install-Package IronOcr.Languages.Han
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Han;
using (var Input = new OcrInput(@"images\Han.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
'PM> Install-Package IronOcr.Languages.Han
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Han
Using Input = New OcrInput("images\Han.png")
Dim Result = Ocr.Read(Input)
Dim AllText = Result.Text
End Using