Packs linguistiques supplémentaires de l'OCR
IronOCR prend en charge 125 langues internationales, mais seulement Anglais est installé en standard dans IronOCR.
Des packs de langues supplémentaires peuvent être facilement ajoutés à vos applications C#, VB ouASP .NET via NuGet ou sous forme de Dlls qui peuvent être téléchargées et ajoutées en tant que références du projet.
Exemples de codes
Exemple de langue internationale
//PM> Install-Package IronOcr.Languages.ChineseSimplified
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
input.AddImage("img/chinese.gif");
// Add image filters if needed
// Input.Deskew();
// Input.DeNoise();
OcrResult result = ocr.Read(input);
string TestResult = result.Text;
// Console can't print unicode. Save to disk instead.
result.SaveAsTextFile("chinese.txt");
}
//PM> Install-Package IronOcr.Languages.ChineseSimplified
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
input.AddImage("img/chinese.gif");
// Add image filters if needed
// Input.Deskew();
// Input.DeNoise();
OcrResult result = ocr.Read(input);
string TestResult = result.Text;
// Console can't print unicode. Save to disk instead.
result.SaveAsTextFile("chinese.txt");
}
'PM> Install-Package IronOcr.Languages.ChineseSimplified
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.ChineseSimplified
Using input = New OcrInput()
input.AddImage("img/chinese.gif")
' Add image filters if needed
' Input.Deskew();
' Input.DeNoise();
Dim result As OcrResult = ocr.Read(input)
Dim TestResult As String = result.Text
' Console can't print unicode. Save to disk instead.
result.SaveAsTextFile("chinese.txt")
End Using
Exemple de langue écrite verticalement
Dictionnaires adaptés à la langue écrite verticalement. Utiliser la variante "verticale" de l'OcrLanguage coréen et japonais.
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.JapaneseVertical;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.JapaneseVertical;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.JapaneseVertical
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Exemple de langue personnalisée
Pour utiliser tout fichier linguistique Tesseract .Traineddata que vous avez téléchargé ou formé vous-même
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata")
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Exemple de langues multiples
Plus d'une langue à la fois.
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
ocr.AddSecondaryLanguage(OcrLanguage.Arabic);
// Add any number of languages
using (var input = new OcrInput(@"images\multi-lang.pdf"))
{
var Result = ocr.Read(input);
Console.WriteLine(Result.Text);
}
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
ocr.AddSecondaryLanguage(OcrLanguage.Arabic);
// Add any number of languages
using (var input = new OcrInput(@"images\multi-lang.pdf"))
{
var Result = ocr.Read(input);
Console.WriteLine(Result.Text);
}
'PM> Install-Package IronOcr.Languages.Arabic
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.English
ocr.AddSecondaryLanguage(OcrLanguage.Arabic)
' Add any number of languages
Using input = New OcrInput("images\multi-lang.pdf")
Dim Result = ocr.Read(input)
Console.WriteLine(Result.Text)
End Using
Exemple de langue plus rapide
Des dictionnaires adaptés à la vitesse. Utilisez la variante "Fast" de n'importe quel langage OcrLanguage.
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.EnglishFast;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.EnglishFast;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.EnglishFast
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Exemple de langage détaillé de plus grande précision
Des dictionnaires adaptés à la précision, mais des résultats beaucoup plus lents. Utiliser la "meilleure" variante de n'importe quelle langue OcrLanguage.
//PM> Install-Package IronOcr.Languages.French
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.FrenchBest;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
//PM> Install-Package IronOcr.Languages.French
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.FrenchBest;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
'PM> Install-Package IronOcr.Languages.French
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.FrenchBest
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Comment installer les packs linguistiques de l'OCR
D'autres packs linguistiques de l'OCR peuvent être téléchargés ci-dessous. Soit
- Installer le paquetage NuGet. Rechercher des langues IronOCR dans NuGet.
- Vous pouvez également télécharger le fichier "ocrdata" et l'ajouter à votre projet .NET dans le dossier de votre choix. Set
CopyToOutputDirectory = CopyIfNewer
(Copier vers le répertoire de sortie)
Télécharger les packs linguistiques OCR
Pack langue grecque ancienne ἙλληνικήZip NuGet
Pack langue assamaise অসমীয়াZip NuGet
Pack langue bretonne brezhonegZip NuGet
Alphabet autochtone canadien Premières nations du CanadaZip NuGet
Pack langue cherokee ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗZip NuGet
Pack langue cyrillique Ecritures cyrilliquesZip NuGet
Pack linguistique Divehi ދިވެހިZip NuGet
Pack langue féroïenne føroysktZip NuGet
Pack linguistique philippin Les PhilippinesZip NuGet
Pack linguistique financier Feuilles de calcul et nombresZip NuGet
Fraktur Language Pack Fraktur génériqueZip NuGet
Pack langue franque FrenkiskZip NuGet
Pack langue Hangul Alphabet HangulZip NuGet
Pack Langue Javanaise basa JawaZip NuGet
Pack langue malaise bahasa MelayuZip NuGet
Pack langue malayalam മലയാളംZip NuGet
Pack langue maori te reo MāoriZip NuGet
Pack linguistique MICR Reconnaissance de caractères à l'encre magnétiqueZip NuGet
Pack linguistique anglais moyen Anglais (1100-1500 AD)Zip NuGet
Pack linguistique français moyen Moyen FrançaisZip NuGet
Pack linguistique Myanmar BirmaneZip NuGet
Pack linguistique kurde du nord KurmanjiZip NuGet
Pack linguistique occitan occitanZip NuGet
Pack langue quechua Runa SimiZip NuGet
Pack langue sanskrite संस्कृतम्Zip NuGet
Pack langue syriaque SyrienneZip NuGet
Pack langue tibétaine Norme tibétaineZip NuGet
Pack linguistique Tonga faka TongaZip NuGet
- Pack langue yoruba YorùbáZip NuGet
Aide
Si la langue que vous cherchez à lire n'est pas disponible dans la liste ci-dessus, veuillezprendre contact avec nous. De nombreuses autres langues sont disponibles sur demande.
La priorité sur les ressources de production est donnée aux détenteurs de licences IronOCRoctroi de licences IronOCR pour accéder au pack linguistique de votre choix.