C#および.NETにおける簡体字中国語OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

126の言語に対応

IronOCRは、C#ソフトウェアコンポーネントであり、.NETコーダーが簡体字漢字を含む126の言語で画像およびPDF文書からテキストを読み取ることを可能にします。

.NET開発者専用に構築されたTesseractの高度なフォークであり、速度と精度の両面で他のTesseractエンジンを定期的に上回ります。

IronOCR.Languages.Hanの内容

このパッケージには、.NET用の400のOCR言語が含まれています:

  • HanSimplifiedAlphabet

(ハン簡体字アルファベット)

  • HanSimplifiedAlphabetBest (簡体字アルファベットベスト)(簡体字漢字ベストアルファベット)

    HanSimplifiedAlphabetFast(簡体字版のアルファベットの高速モード)

  • ハンシンプリファイドバーティカルアルファベット
  • HanSimplifiedVerticalAlphabetBest(ハンシンプリファイドバーティカルアルファベットベスト)
  • 漢字簡体縦書きアルファベット速
  • 繁体字
  • 漢字TraditionalAlphabetBest

    繁体漢字アルファベット高速(ハントラディショナルアルファベットファスト)

  • 縦書き反転漢字アルファベット
  • 漢字縦書きベスト
  • ハン伝統縦文字速さ

ダウンロード

簡体字漢字アルファベット言語パック [サムハン]

インストール

まず最初に、.NETプロジェクトにHan Simplified Alphabet OCRパッケージをインストールする必要があります。

PM> Install-Package IronOCR.Languages.Han

コード例

このC#コード例は、画像またはPDFドキュメントから簡体字漢字テキストを読み取ります。

//PM> Install-Package IronOcr.Languages.Han
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Han;
using (var Input = new OcrInput(@"images\Han.png"))
{
    var Result = Ocr.Read(Input);
    var AllText =  Result.Text;
}
//PM> Install-Package IronOcr.Languages.Han
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Han;
using (var Input = new OcrInput(@"images\Han.png"))
{
    var Result = Ocr.Read(Input);
    var AllText =  Result.Text;
}
'PM> Install-Package IronOcr.Languages.Han
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Han
Using Input = New OcrInput("images\Han.png")
	Dim Result = Ocr.Read(Input)
	Dim AllText = Result.Text
End Using
VB   C#