Maori OCR in C# and .NET
IronOCR to komponent oprogramowania C#, który umożliwia programistom .NET odczytywanie tekstu z obrazów i dokumentów PDF w 126 językach, w tym maoryskim.
Jest to zaawansowana gałąź Tesseract, zbudowana wyłącznie dla programistów .NET i regularnie przewyższa inne silniki Tesseract zarówno pod względem prędkości, jak i dokładności.
Zawartość IronOcr.Languages.Maori
Ten pakiet zawiera 40 języków OCR dla .NET:
- Maori
- MaoriBest
- MaoriFast
Pobieranie
Maori Language Pack [te reo Māori]
Instalacja
Pierwszą rzeczą, którą musimy zrobić, jest zainstalowanie naszego pakietu OCR Maori do twojego projektu .NET.
Install-Package IronOcr.Languages.Maori
Przyklad kodu
Ten przykład kodu C# odczytuje tekst w języku maoryskim z obrazu lub dokumentu PDF.
// Install the IronOCR Maori language package using NuGet
// PM> Install-Package IronOcr.Languages.Maori
using IronOcr;
var Ocr = new IronTesseract();
// Specify the language to be Maori
Ocr.Language = OcrLanguage.Maori;
using (var Input = new OcrInput(@"images\Maori.png"))
{
// Perform OCR to extract text
var Result = Ocr.Read(Input);
// Retrieve the recognized text
var AllText = Result.Text;
// Optionally, print the extracted text
// Console.WriteLine(AllText);
}
// Install the IronOCR Maori language package using NuGet
// PM> Install-Package IronOcr.Languages.Maori
using IronOcr;
var Ocr = new IronTesseract();
// Specify the language to be Maori
Ocr.Language = OcrLanguage.Maori;
using (var Input = new OcrInput(@"images\Maori.png"))
{
// Perform OCR to extract text
var Result = Ocr.Read(Input);
// Retrieve the recognized text
var AllText = Result.Text;
// Optionally, print the extracted text
// Console.WriteLine(AllText);
}
' Install the IronOCR Maori language package using NuGet
' PM> Install-Package IronOcr.Languages.Maori
Imports IronOcr
Private Ocr = New IronTesseract()
' Specify the language to be Maori
Ocr.Language = OcrLanguage.Maori
Using Input = New OcrInput("images\Maori.png")
' Perform OCR to extract text
Dim Result = Ocr.Read(Input)
' Retrieve the recognized text
Dim AllText = Result.Text
' Optionally, print the extracted text
' Console.WriteLine(AllText);
End Using
Wyjaśnienie
- IronTesseract to instancja, która pozwala na przeprowadzenie OCR.
- Ocr.Language jest ustawiony na Maori, aby określić język tekstu, który odczytujemy.
- OcrInput służy do przechwytywania danych wejściowych z obrazu z określoną ścieżką pliku.
- Ocr.Read() wykonuje OCR i pobiera wynik.
- Result.Text zawiera wyodrębniony tekst z obrazu, który można przechowywać lub przetwarzać zgodnie z potrzebami.
Ten zestaw kodu zapewnia, że używany jest odpowiedni pakiet językowy OCR, aby osiągnąć dokładne rozpoznawanie tekstu.

