使用 C# 和 .NET 實作普什圖語 OCR
This article was translated from English: Does it need improvement?
TranslatedView the article in English
Other versions of this document:
IronOCR 是一個 C# 軟體元件,允許 .NET 程式設計師從圖像和 PDF 文件中讀取 126 種語言(包括普什圖語)的文字。 它是 Tesseract 的一個高級分支,專為 .NET 開發人員構建,在速度和準確性方面通常優於其他 Tesseract 引擎。
IronOcr.Languages.Pashto 的內容
此軟體包包含 43 種適用於 .NET 的 OCR 語言:
- 普什圖語
- 普什圖語Best
- 普什圖語Fast
下載
普什圖語語言包[普什圖語]
下載為Zip 檔案
- 使用NuGet安裝
安裝
我們首先需要做的就是將我們的普什圖語OCR 套件安裝到您的 .NET 專案中。
Install-Package IronOCR.Languages.Pashto
程式碼範例
這段 C# 程式碼範例從圖像或 PDF 文件中讀取普什圖語文字。
// Import the IronOcr namespace
using IronOcr;
public class PashtoOcrExample
{
public static void Main()
{
// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();
// Set the OCR language to Pashto
Ocr.Language = OcrLanguage.Pashto;
// Specify the image file containing the Pashto text
using (var Input = new OcrInput(@"images\Pashto.png"))
{
// Perform the OCR operation on the input image
var Result = Ocr.Read(Input);
// Store the extracted text from the image in a string variable
var AllText = Result.Text;
}
}
}// Import the IronOcr namespace
using IronOcr;
public class PashtoOcrExample
{
public static void Main()
{
// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();
// Set the OCR language to Pashto
Ocr.Language = OcrLanguage.Pashto;
// Specify the image file containing the Pashto text
using (var Input = new OcrInput(@"images\Pashto.png"))
{
// Perform the OCR operation on the input image
var Result = Ocr.Read(Input);
// Store the extracted text from the image in a string variable
var AllText = Result.Text;
}
}
}$vbLabelText $csharpLabel
- 此程式碼片段示範如何使用 IronOCR 函式庫來辨識普什圖語文字。
- 它設定
IronTesseract類,選擇普什圖語作為語言,並處理圖像檔案(Pashto.png)以提取和顯示文字。





