Paquetes de idiomas OCR adicionales

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR admite 125 idiomas internacionales, pero sólo Inglés está instalado de serie en IronOCR.

Los paquetes de idiomas adicionales se pueden añadir fácilmente a su C#, VB oASP .NET a través de NuGet o como Dlls que pueden descargarse y añadirse como referencias del proyecto.



Ejemplos de código

Ejemplo de lengua internacional

//PM> Install-Package IronOcr.Languages.ChineseSimplified
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
    input.AddImage("img/chinese.gif");
    // Add image filters if needed
    // Input.Deskew();
    // Input.DeNoise();
    OcrResult result = ocr.Read(input);
    string TestResult = result.Text;
    // Console can't print unicode. Save to disk instead.
    result.SaveAsTextFile("chinese.txt");
}
//PM> Install-Package IronOcr.Languages.ChineseSimplified
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
    input.AddImage("img/chinese.gif");
    // Add image filters if needed
    // Input.Deskew();
    // Input.DeNoise();
    OcrResult result = ocr.Read(input);
    string TestResult = result.Text;
    // Console can't print unicode. Save to disk instead.
    result.SaveAsTextFile("chinese.txt");
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Ejemplo de lenguaje escrito verticalmente

Diccionarios adaptados a la escritura vertical. Utilice la variante "vertical" de OcrLanguage de Corea y Japón.

using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.JapaneseVertical;
using (var input = new OcrInput(@"images\image.png"))
{
    OcrResult result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.JapaneseVertical;
using (var input = new OcrInput(@"images\image.png"))
{
    OcrResult result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Ejemplo de lenguaje personalizado

Para utilizar cualquier archivo de lenguaje Tesseract .Traineddata que haya descargado o entrenado usted mismo

using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var input = new OcrInput(@"images\image.png"))
{
    OcrResult result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var input = new OcrInput(@"images\image.png"))
{
    OcrResult result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Ejemplo de varios idiomas

Más de una Lengua a la vez.

//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
ocr.AddSecondaryLanguage(OcrLanguage.Arabic);
// Add any number of languages
using (var input = new OcrInput(@"images\multi-lang.pdf"))
{
    var Result = ocr.Read(input);
    Console.WriteLine(Result.Text);
}
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
ocr.AddSecondaryLanguage(OcrLanguage.Arabic);
// Add any number of languages
using (var input = new OcrInput(@"images\multi-lang.pdf"))
{
    var Result = ocr.Read(input);
    Console.WriteLine(Result.Text);
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Ejemplo de lenguaje más rápido

Diccionarios adaptados a la velocidad. Utilice la variante 'Fast' de cualquier OcrLanguage.

using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.EnglishFast;
using (var input = new OcrInput(@"images\image.png"))
{
    OcrResult result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.EnglishFast;
using (var input = new OcrInput(@"images\image.png"))
{
    OcrResult result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.EnglishFast
Using input = New OcrInput("images\image.png")
	Dim result As OcrResult = ocr.Read(input)
	Console.WriteLine(result.Text)
End Using
VB   C#

Ejemplo de lenguaje detallado de mayor precisión

Diccionarios ajustados para una mayor precisión, pero resultados mucho más lentos. Utiliza la variante 'Best' de cualquier OcrLanguage.

//PM> Install-Package IronOcr.Languages.French
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.FrenchBest;
using (var input = new OcrInput(@"images\image.png"))
{
    OcrResult result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
//PM> Install-Package IronOcr.Languages.French
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.FrenchBest;
using (var input = new OcrInput(@"images\image.png"))
{
    OcrResult result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
'PM> Install-Package IronOcr.Languages.French
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.FrenchBest
Using input = New OcrInput("images\image.png")
	Dim result As OcrResult = ocr.Read(input)
	Console.WriteLine(result.Text)
End Using
VB   C#

Cómo instalar paquetes de idiomas OCR

A continuación puede descargar más paquetes de idiomas OCR. O bien

  • Instale el paquete NuGet. Buscar lenguajes IronOcr en NuGet.
  • O descargue el archivo "ocrdata" y añádalo a su proyecto .NET en la carpeta que desee. Establecer CopyToOutputDirectory = CopyIfNewer.

Descargar paquetes de idiomas OCR

Ayuda

Si el idioma que desea leer no está disponible en la lista anterior, por favorponerse en contacto con nosotros. Hay muchos otros idiomas disponibles previa petición.

Los licenciatarios de IronOCR tienen prioridad sobre los recursos de producción, por lo que también deben tener en cuenta lo siguientelicencias IronOCR para acceder al paquete de idiomas que desee.