簡体字漢字アルファベットOCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

他の126の言語

IronOCRは、C#ソフトウェアコンポーネントであり、.NETコーダーが簡体字漢字を含む126の言語で画像およびPDF文書からテキストを読み取ることを可能にします。

.NET開発者専用に構築されたTesseractの高度なフォークであり、速度と精度の両面で他のTesseractエンジンを定期的に上回ります。

IronOCR.Languages.Hanの内容

このパッケージには、.NET用の400のOCR言語が含まれています:

  • HanSimplifiedAlphabet

(ハン簡体字アルファベット)

  • HanSimplifiedAlphabetBest (簡体字漢字ベストアルファベット)
  • HanSimplifiedAlphabetFast (簡体字版のアルファベットの高速モード)
  • ハンシンプリファイドバーティカルアルファベット
  • HanSimplifiedVerticalAlphabetBest(ハンシンプリファイドバーティカルアルファベットベスト)
  • 漢字簡体縦書きアルファベット速
  • 繁体字
  • 漢字TraditionalAlphabetBest
  • HanTraditionalAlphabetFast (ハントラディショナルアルファベットファスト)
  • 縦書き反転漢字アルファベット
  • 漢字縦書きベスト
  • ハン伝統縦文字速さ

ダウンロード

Hán簡体字アルファベット言語パック [Samhan]

インストール

最初に行うべきことは、Han Simplified Alphabet OCRパッケージを.NETプロジェクトにインストールすることです。

PM> Install-Package IronOCR.Languages.Han

コード例

このC#コード例は、画像またはPDFドキュメントから簡体字漢字テキストを読み取ります。

//PM> Install-Package IronOcr.Languages.Han
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Han;
using (var Input = new OcrInput(@"images\Han.png"))
{
    var Result = Ocr.Read(Input);
    var AllText =  Result.Text;
}
//PM> Install-Package IronOcr.Languages.Han
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Han;
using (var Input = new OcrInput(@"images\Han.png"))
{
    var Result = Ocr.Read(Input);
    var AllText =  Result.Text;
}
'PM> Install-Package IronOcr.Languages.Han
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Han
Using Input = New OcrInput("images\Han.png")
	Dim Result = Ocr.Read(Input)
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel