Han Simplified Alphabet OCR in C# and .NET

Curtis Chau

已更新:2026年4月22日

Translated

View the article in English

还有126种语言

IronOCR 是一个 C# 软件组件，允许 .NET 程序员从图像和 PDF 文档中读取 126 种语言的文本，包括简体汉字。

它是 Tesseract 的一个高级分支，专为 .NET 开发人员构建，在速度和准确性方面通常优于其他 Tesseract 引擎。

IronOcr.Languages.Han 的内容

此软件包包含 400 种适用于 .NET 的 OCR 语言：

HanSimplifiedAlphabet
HanSimplifiedAlphabetBest
HanSimplifiedAlphabetFast
HanSimplifiedVerticalAlphabet
HanSimplifiedVerticalAlphabetBest
HanSimplifiedVerticalAlphabetFast
HanTraditionalAlphabet
HanTraditionalAlphabetBest
HanTraditionalAlphabetFast
HanTraditionalVerticalAlphabet
HanTraditionalVerticalAlphabetBest
汉字传统竖式字母快速

下载

汉字简体字母语言包 [Samhan]

Download as [Zip](javascript:window.open("/csharp/ocr/packages/language-packs/Han.ocrdata.zip")
使用NuGet安装

安装

我们首先需要做的是将我们的汉字简体字母OCR 包安装到您的 .NET 项目中。

在Package Manager Console中运行以下命令：

Install-Package IronOcr.Languages.Han

代码示例

这段 C# 代码示例从图像或 PDF 文档中读取简体汉字文本。

// Reference the IronOcr library
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Load the Han language for OCR processing
        Ocr.Language = OcrLanguage.Han;

        // Using a 'using' statement for resource management
        using (var Input = new OcrInput(@"images\Han.png"))
        {
            // Process the image to extract text
            var Result = Ocr.Read(Input);

            // Retrieve and display the extracted text
            string AllText = Result.Text;
            System.Console.WriteLine(AllText);
        }
    }
}

// Reference the IronOcr library
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Load the Han language for OCR processing
        Ocr.Language = OcrLanguage.Han;

        // Using a 'using' statement for resource management
        using (var Input = new OcrInput(@"images\Han.png"))
        {
            // Process the image to extract text
            var Result = Ocr.Read(Input);

            // Retrieve and display the extracted text
            string AllText = Result.Text;
            System.Console.WriteLine(AllText);
        }
    }
}

' Reference the IronOcr library
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		' Create an IronTesseract OCR engine
		Dim Ocr = New IronTesseract()

		' Load the Han language for OCR processing
		Ocr.Language = OcrLanguage.Han

		' Using a 'using' statement for resource management
		Using Input = New OcrInput("images\Han.png")
			' Process the image to extract text
			Dim Result = Ocr.Read(Input)

			' Retrieve and display the extracted text
			Dim AllText As String = Result.Text
			System.Console.WriteLine(AllText)
		End Using
	End Sub
End Class

$vbLabelText $csharpLabel

解释

我们首先引用 IronOCR库以利用其 OCR 功能。
创建一个 IronTesseract 实例来处理图像/PDF 文档。
OCR 处理的语言已通过 Ocr.Language 设置为 Han。
通过 OcrInput 加载图像，并通过调用 Ocr.Read() 进行处理。
OCR 处理的结果存储在 Result.Text 中，其中包含从文档中提取的文本。最后，我们将文本打印到控制台。

请确保正确使用 using 指令，并通过 using 语句高效管理资源，特别是在处理文件流等非托管资源时。

客户亮点：

开发者焦点：

网络研讨会：

开始免费 30 天试用

本页内容

Han Simplified Alphabet OCR in C# and .NET

IronOcr.Languages.Han 的内容

下载

安装

代码示例

解释

钢铁支援团队

开始免费 30 天试用

本页内容

Han Simplified Alphabet OCR in C# and .NET

IronOcr.Languages.Han 的内容

下载

安装

代码示例

解释

下一步：开始免费 30 天试用

Thank You

下一步：开始免费 30 天试用

Want to deploy IronSuite to a live project for FREE?

What’s included?

深受全球数百万工程师信赖

钢铁支援团队