Irish OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
本文檔的其他版本:

愛爾蘭語 新增 125 種 OCR 語言

IronOCR是一個 C# 軟體元件,允許.NET設計師從圖像和 PDF 文件中讀取 126 種語言(包括愛爾蘭語)的文字。

它是 Tesseract 的一個高級分支,專為.NET開發人員構建,在速度和準確性方面通常優於其他 Tesseract 引擎。

IronOCR的內容。語言。愛爾蘭語

此軟體包包含 40 種適用於.NET的 OCR 語言:

  • 愛爾蘭
  • IrishBest
  • 愛爾蘭快車

下載

愛爾蘭語包[Gaeilge]

安裝

我們首先需要做的是將我們的愛爾蘭語OCR 套件安裝到您的.NET專案中。

Install-Package IronOcr.Languages.Irish

程式碼範例

此 C# 程式碼範例從圖像或 PDF 文件中讀取愛爾蘭語文字。

// Install the IronOCR Irish language package via NuGet:
// PM> Install-Package IronOcr.Languages.Irish

using IronOcr;

class IrishOcrExample
{
    static void Main()
    {
        // Create a new instance of the IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the language to Irish for OCR processing
        Ocr.Language = OcrLanguage.Irish;

        // Using the OCR input, specify the path to the image containing Irish text
        using (var Input = new OcrInput(@"images\Irish.png"))
        {
            // Perform OCR to read the Irish text from the image
            var Result = Ocr.Read(Input);

            // Get the recognized text as a string from the OCR result
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
// Install the IronOCR Irish language package via NuGet:
// PM> Install-Package IronOcr.Languages.Irish

using IronOcr;

class IrishOcrExample
{
    static void Main()
    {
        // Create a new instance of the IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the language to Irish for OCR processing
        Ocr.Language = OcrLanguage.Irish;

        // Using the OCR input, specify the path to the image containing Irish text
        using (var Input = new OcrInput(@"images\Irish.png"))
        {
            // Perform OCR to read the Irish text from the image
            var Result = Ocr.Read(Input);

            // Get the recognized text as a string from the OCR result
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

在這個例子中,我們利用IronOCR函式庫中的 IronTesseract 類別對包含愛爾蘭文字的圖像執行 OCR。 OcrInput 物件用於載入圖像,Ocr.Read 方法用於處理圖像以提取文字。 然後將生成的文字儲存在 AllText 變數中,並列印到控制台。