C#および.NETにおける簡体字中国語OCR
IronOCRは、C#ソフトウェアコンポーネントであり、.NETコーダーが簡体字漢字を含む126の言語で画像およびPDF文書からテキストを読み取ることを可能にします。
.NET開発者専用に構築されたTesseractの高度なフォークであり、速度と精度の両面で他のTesseractエンジンを定期的に上回ります。
IronOCR.Languages.Hanの内容
このパッケージには、.NET用の400のOCR言語が含まれています:
- HanSimplifiedAlphabet
(ハン簡体字アルファベット)
-
HanSimplifiedAlphabetBest (簡体字アルファベットベスト)(簡体字漢字ベストアルファベット)
HanSimplifiedAlphabetFast(簡体字版のアルファベットの高速モード)
- ハンシンプリファイドバーティカルアルファベット
- HanSimplifiedVerticalAlphabetBest(ハンシンプリファイドバーティカルアルファベットベスト)
- 漢字簡体縦書きアルファベット速
- 繁体字
-
漢字TraditionalAlphabetBest
繁体漢字アルファベット高速(ハントラディショナルアルファベットファスト)
- 縦書き反転漢字アルファベット
- 漢字縦書きベスト
- ハン伝統縦文字速さ
ダウンロード
簡体字漢字アルファベット言語パック [サムハン]
インストール
まず最初に、.NETプロジェクトにHan Simplified Alphabet OCRパッケージをインストールする必要があります。
PM> Install-Package IronOCR.Languages.Han
コード例
このC#コード例は、画像またはPDFドキュメントから簡体字漢字テキストを読み取ります。
//PM> Install-Package IronOcr.Languages.Han
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Han;
using (var Input = new OcrInput(@"images\Han.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
//PM> Install-Package IronOcr.Languages.Han
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Han;
using (var Input = new OcrInput(@"images\Han.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
'PM> Install-Package IronOcr.Languages.Han
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Han
Using Input = New OcrInput("images\Han.png")
Dim Result = Ocr.Read(Input)
Dim AllText = Result.Text
End Using