Indonesian OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Andere Versionen dieses Dokuments:

IronOCR ist eine C# Softwarekomponente, die es .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Indonesisch, zu lesen. Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv for .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalt von IronOcr.Languages.Indonesian

Dieses Paket enthält 55 OCR-Sprachen for .NET:

  • Indonesisch
  • IndonesischBest
  • IndonesischSchnell

Download

Indonesisches Sprachpaket [Bahasa Indonesia]

Installation

Das Erste, was wir tun müssen, ist, unser Indonesisches OCR-Paket in Ihr .NET-Projekt zu installieren.

Install-Package IronOcr.Languages.Indonesian

Beispielcode

Dieses C#-Code-Beispiel liest indonesischen Text aus einem Bild oder PDF-Dokument.

// Ensure the IronOCR package is installed:
// PM> Install-Package IronOcr.Languages.Indonesian

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Indonesian
Ocr.Language = OcrLanguage.Indonesian;

// Use the OCR engine to read text from an image
using (var Input = new OcrInput(@"images\Indonesian.png"))
{
    // Perform OCR on the given input
    var Result = Ocr.Read(Input);

    // Retrieve all recognized text
    var AllText = Result.Text;

    // Print the recognized text to the console
    Console.WriteLine(AllText);
}
// Ensure the IronOCR package is installed:
// PM> Install-Package IronOcr.Languages.Indonesian

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Indonesian
Ocr.Language = OcrLanguage.Indonesian;

// Use the OCR engine to read text from an image
using (var Input = new OcrInput(@"images\Indonesian.png"))
{
    // Perform OCR on the given input
    var Result = Ocr.Read(Input);

    // Retrieve all recognized text
    var AllText = Result.Text;

    // Print the recognized text to the console
    Console.WriteLine(AllText);
}
' Ensure the IronOCR package is installed:
' PM> Install-Package IronOcr.Languages.Indonesian

Imports IronOcr

Private Ocr = New IronTesseract()
' Set the OCR language to Indonesian
Ocr.Language = OcrLanguage.Indonesian

' Use the OCR engine to read text from an image
Using Input = New OcrInput("images\Indonesian.png")
	' Perform OCR on the given input
	Dim Result = Ocr.Read(Input)

	' Retrieve all recognized text
	Dim AllText = Result.Text

	' Print the recognized text to the console
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel
  • Dieses Skript zeigt, wie die IronTesseract OCR-Engine verwendet wird, um indonesischen Text aus einem Bild zu lesen und zu erkennen.
  • Es verwendet die Klasse OcrInput, um das Quellbild anzugeben, und anschließend Ocr.Read(), um das Bild zu verarbeiten und Text zu extrahieren. Der erkannte Text wird in der Variable AllText gespeichert und auf der Konsole ausgegeben.