IronOCR 语言 孟加拉语 Bengali OCR in C# and .NET Curtis Chau 已更新:2026年1月31日 下载 IronOCR NuGet 下载 DLL 下载 Windows 安装程序 免费试用 LLM副本 LLM副本 将页面复制为 Markdown 格式,用于 LLMs 在 ChatGPT 中打开 向 ChatGPT 咨询此页面 在双子座打开 向 Gemini 询问此页面 在 Grok 中打开 向 Grok 询问此页面 打开困惑 向 Perplexity 询问有关此页面的信息 分享 在 Facebook 上分享 分享到 X(Twitter) 在 LinkedIn 上分享 复制链接 电子邮件文章 This article was translated from English: Does it need improvement? Translated View the article in English 本文档的其他版本: 孟加拉语 新增 125 种 OCR 语言 IronOCR 是一个 C# 软件组件,允许 .NET 程序员从图像和 PDF 文档中读取 126 种语言(包括孟加拉语)的文本。 它是 Tesseract 的一个高级分支,专为 .NET 开发人员构建,在速度和准确性方面通常优于其他 Tesseract 引擎。 IronOcr.Languages.Bengali 的内容 此软件包包含 114 种适用于 .NET 的 OCR 语言: 孟加拉语 BengaliBest BengaliFast 孟加拉字母 BengalaliAlphabetBest 孟加拉语字母快速 下载 孟加拉语语言包[Bangla] 下载为Zip 文件 使用NuGet安装 安装 我们首先需要做的就是将我们的孟加拉语OCR 包安装到您的 .NET 项目中。 Install-Package IronOcr.Languages.Bengali 代码示例 这段 C# 代码示例从图像或 PDF 文档中读取孟加拉语文本。 // Import the IronOcr namespace using IronOcr; class BengaliOcrExample { static void Main() { // Create an instance of IronTesseract var Ocr = new IronTesseract(); // Specify the language for OCR Ocr.Language = OcrLanguage.Bengali; // Process the image and extract text using (var Input = new OcrInput(@"images\Bengali.png")) { // Perform OCR on the input image var Result = Ocr.Read(Input); // Get the extracted text var AllText = Result.Text; // Output the extracted text to the console System.Console.WriteLine(AllText); } } } // Import the IronOcr namespace using IronOcr; class BengaliOcrExample { static void Main() { // Create an instance of IronTesseract var Ocr = new IronTesseract(); // Specify the language for OCR Ocr.Language = OcrLanguage.Bengali; // Process the image and extract text using (var Input = new OcrInput(@"images\Bengali.png")) { // Perform OCR on the input image var Result = Ocr.Read(Input); // Get the extracted text var AllText = Result.Text; // Output the extracted text to the console System.Console.WriteLine(AllText); } } } $vbLabelText $csharpLabel 解释 1.导入IronOCR:我们首先导入 IronOcr 命名空间,其中包含执行 OCR 操作所需的类和方法。 2.创建 IronTesseract 实例:我们创建 IronTesseract 的实例,它是执行 OCR 的主要类。 3.设置语言:我们使用 OcrLanguage.Bengali 将 OCR 语言设置为孟加拉语。 OcrInput:我们指定要从中提取文本的图像路径。 使用 OcrInput 对象来加载和预处理输入文件。 5.读取和提取文本:使用 Read 方法,我们处理图像以读取文本内容。 文本存储在 Result.Text。 6.输出文本:最后,我们将提取的文本打印到控制台以验证输出。