Packs linguistiques supplémentaires de l'OCR
IronOCR prend en charge 125 langues internationales, mais seulement Anglais est installé en standard dans IronOCR.
Des packs de langues supplémentaires peuvent être facilement ajoutés à vos applications C#, VB ouASP .NET via NuGet ou sous forme de Dlls qui peuvent être téléchargées et ajoutées en tant que références du projet.
Exemples de codes
Exemple de langue internationale
//PM> Install-Package IronOcr.Languages.ChineseSimplified
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
input.AddImage("img/chinese.gif");
// Add image filters if needed
// Input.Deskew();
// Input.DeNoise();
OcrResult result = ocr.Read(input);
string TestResult = result.Text;
// Console can't print unicode. Save to disk instead.
result.SaveAsTextFile("chinese.txt");
}
//PM> Install-Package IronOcr.Languages.ChineseSimplified
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
input.AddImage("img/chinese.gif");
// Add image filters if needed
// Input.Deskew();
// Input.DeNoise();
OcrResult result = ocr.Read(input);
string TestResult = result.Text;
// Console can't print unicode. Save to disk instead.
result.SaveAsTextFile("chinese.txt");
}
'PM> Install-Package IronOcr.Languages.ChineseSimplified
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.ChineseSimplified
Using input = New OcrInput()
input.AddImage("img/chinese.gif")
' Add image filters if needed
' Input.Deskew();
' Input.DeNoise();
Dim result As OcrResult = ocr.Read(input)
Dim TestResult As String = result.Text
' Console can't print unicode. Save to disk instead.
result.SaveAsTextFile("chinese.txt")
End Using
Exemple de langue écrite verticalement
Dictionnaires adaptés à la langue écrite verticalement. Utiliser la variante "verticale" de l'OcrLanguage coréen et japonais.
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.JapaneseVertical;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.JapaneseVertical;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.JapaneseVertical
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Exemple de langue personnalisée
Pour utiliser tout fichier linguistique Tesseract .Traineddata que vous avez téléchargé ou formé vous-même
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata")
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Exemple de langues multiples
Plus d'une langue à la fois.
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
ocr.AddSecondaryLanguage(OcrLanguage.Arabic);
// Add any number of languages
using (var input = new OcrInput(@"images\multi-lang.pdf"))
{
var Result = ocr.Read(input);
Console.WriteLine(Result.Text);
}
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
ocr.AddSecondaryLanguage(OcrLanguage.Arabic);
// Add any number of languages
using (var input = new OcrInput(@"images\multi-lang.pdf"))
{
var Result = ocr.Read(input);
Console.WriteLine(Result.Text);
}
'PM> Install-Package IronOcr.Languages.Arabic
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.English
ocr.AddSecondaryLanguage(OcrLanguage.Arabic)
' Add any number of languages
Using input = New OcrInput("images\multi-lang.pdf")
Dim Result = ocr.Read(input)
Console.WriteLine(Result.Text)
End Using
Exemple de langue plus rapide
Des dictionnaires adaptés à la vitesse. Utilisez la variante "Fast" de n'importe quel langage OcrLanguage.
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.EnglishFast;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.EnglishFast;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.EnglishFast
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Exemple de langage détaillé de plus grande précision
Des dictionnaires adaptés à la précision, mais des résultats beaucoup plus lents. Utiliser la "meilleure" variante de n'importe quelle langue OcrLanguage.
//PM> Install-Package IronOcr.Languages.French
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.FrenchBest;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
//PM> Install-Package IronOcr.Languages.French
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.FrenchBest;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
'PM> Install-Package IronOcr.Languages.French
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.FrenchBest
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Comment installer les packs linguistiques de l'OCR
D'autres packs linguistiques de l'OCR peuvent être téléchargés ci-dessous. Soit
- Installer le paquetage NuGet. Rechercher des langues IronOCR dans NuGet.
- Vous pouvez également télécharger le fichier "ocrdata" et l'ajouter à votre projet .NET dans le dossier de votre choix. Set
CopyToOutputDirectory = CopyIfNewer
(Copier vers le répertoire de sortie)
Télécharger les packs linguistiques OCR
-
Pack langue grecque ancienne ἙλληνικήZip NuGet
-
Pack langue assamaise অসমীয়াZip NuGet
-
Pack langue bretonne brezhonegZip NuGet
-
Alphabet autochtone canadien Premières nations du CanadaZip NuGet
-
Pack langue cherokee ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗZip NuGet
-
Pack langue cyrillique Ecritures cyrilliquesZip NuGet
-
Pack linguistique Divehi ދިވެހިZip NuGet
-
Pack langue féroïenne føroysktZip NuGet
-
Pack linguistique philippin Les PhilippinesZip NuGet
-
Pack linguistique financier Feuilles de calcul et nombresZip NuGet
-
Fraktur Language Pack Fraktur génériqueZip NuGet
-
Pack langue franque FrenkiskZip NuGet
-
Pack langue Hangul Alphabet HangulZip NuGet
-
Pack Langue Javanaise basa JawaZip NuGet
-
Pack langue malaise bahasa MelayuZip NuGet
-
Pack langue malayalam മലയാളംZip NuGet
-
Pack langue maori te reo MāoriZip NuGet
-
Pack linguistique MICR Reconnaissance de caractères à l'encre magnétiqueZip NuGet
-
Pack linguistique anglais moyen Anglais (1100-1500 AD)Zip NuGet
-
Pack linguistique français moyen Moyen FrançaisZip NuGet
-
Pack linguistique Myanmar BirmaneZip NuGet
-
Pack linguistique kurde du nord KurmanjiZip NuGet
-
Pack linguistique occitan occitanZip NuGet
-
Pack langue quechua Runa SimiZip NuGet
-
Pack langue sanskrite संस्कृतम्Zip NuGet
-
Pack langue syriaque SyrienneZip NuGet
-
Pack langue tibétaine Norme tibétaineZip NuGet
-
Pack linguistique Tonga faka TongaZip NuGet
- Pack langue yoruba YorùbáZip NuGet
Aide
Si la langue que vous cherchez à lire n'est pas disponible dans la liste ci-dessus, veuillezprendre contact avec nous. De nombreuses autres langues sont disponibles sur demande.
La priorité sur les ressources de production est donnée aux détenteurs de licences IronOCRoctroi de licences IronOCR pour accéder au pack linguistique de votre choix.