Packs linguistiques supplémentaires de l'OCR
IronOCR prend en charge 125 langues internationales, mais seule l'anglais est installé par défaut dans IronOCR.
Des packs de langues supplémentaires peuvent être facilement ajoutés à votre projet C#, VB ou ASP .NET via NuGet ou sous forme de Dlls pouvant être téléchargés et ajoutés en tant que références de projet.
Exemples de codes
Exemple de langue internationale
//PM> Install-Package IronOcr.Languages.ChineseSimplified
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
input.AddImage("img/chinese.gif");
// Add image filters if needed
// Input.Deskew();
// Input.DeNoise();
OcrResult result = ocr.Read(input);
string TestResult = result.Text;
// Console can't print unicode. Save to disk instead.
result.SaveAsTextFile("chinese.txt");
}
//PM> Install-Package IronOcr.Languages.ChineseSimplified
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.ChineseSimplified;
using (var input = new OcrInput())
{
input.AddImage("img/chinese.gif");
// Add image filters if needed
// Input.Deskew();
// Input.DeNoise();
OcrResult result = ocr.Read(input);
string TestResult = result.Text;
// Console can't print unicode. Save to disk instead.
result.SaveAsTextFile("chinese.txt");
}
'PM> Install-Package IronOcr.Languages.ChineseSimplified
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.ChineseSimplified
Using input = New OcrInput()
input.AddImage("img/chinese.gif")
' Add image filters if needed
' Input.Deskew();
' Input.DeNoise();
Dim result As OcrResult = ocr.Read(input)
Dim TestResult As String = result.Text
' Console can't print unicode. Save to disk instead.
result.SaveAsTextFile("chinese.txt")
End Using
Exemple de langue écrite verticalement
Dictionnaires adaptés à la langue écrite verticalement. Utiliser la variante "verticale" de l'OcrLanguage coréen et japonais.
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.JapaneseVertical;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.JapaneseVertical;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.JapaneseVertical
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Exemple de langue personnalisée
Pour utiliser tout fichier linguistique Tesseract .Traineddata que vous avez téléchargé ou formé vous-même
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata")
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Exemple de langues multiples
Plus d'une langue à la fois.
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
ocr.AddSecondaryLanguage(OcrLanguage.Arabic);
// Add any number of languages
using (var input = new OcrInput(@"images\multi-lang.pdf"))
{
var Result = ocr.Read(input);
Console.WriteLine(Result.Text);
}
//PM> Install-Package IronOcr.Languages.Arabic
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
ocr.AddSecondaryLanguage(OcrLanguage.Arabic);
// Add any number of languages
using (var input = new OcrInput(@"images\multi-lang.pdf"))
{
var Result = ocr.Read(input);
Console.WriteLine(Result.Text);
}
'PM> Install-Package IronOcr.Languages.Arabic
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.English
ocr.AddSecondaryLanguage(OcrLanguage.Arabic)
' Add any number of languages
Using input = New OcrInput("images\multi-lang.pdf")
Dim Result = ocr.Read(input)
Console.WriteLine(Result.Text)
End Using
Exemple de langue plus rapide
Des dictionnaires adaptés à la vitesse. Utilisez la variante "Fast" de n'importe quel langage OcrLanguage.
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.EnglishFast;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.EnglishFast;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.EnglishFast
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Exemple de langage détaillé de plus grande précision
Des dictionnaires adaptés à la précision, mais des résultats beaucoup plus lents. Utiliser la "meilleure" variante de n'importe quelle langue OcrLanguage.
//PM> Install-Package IronOcr.Languages.French
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.FrenchBest;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
//PM> Install-Package IronOcr.Languages.French
using IronOcr;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.FrenchBest;
using (var input = new OcrInput(@"images\image.png"))
{
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
}
'PM> Install-Package IronOcr.Languages.French
Imports IronOcr
Private ocr As New IronTesseract()
ocr.Language = OcrLanguage.FrenchBest
Using input = New OcrInput("images\image.png")
Dim result As OcrResult = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Comment installer les packs linguistiques de l'OCR
D'autres packs linguistiques de l'OCR peuvent être téléchargés ci-dessous. Soit
- Installer le paquetage NuGet. Rechercher IronOcr Languages sur NuGet.
- Ou téléchargez le fichier "ocrdata" et ajoutez-le à votre projet .NET dans le dossier de votre choix. Définissez
CopyToOutputDirectory = CopyIfNewer
Télécharger les packs linguistiques OCR
-
Pack de Langue Grec Ancien ἙλληνικήZip NuGet
-
Pack de Langue Assamaise অসমীয়াZip NuGet
-
Pack de langue bretonne brezhonegZip NuGet
-
Pack de langues pour l'Alphabet Autochtone Canadien Premières Nations CanadiennesZip NuGet
-
Pack de langue cebuano BisayaZip NuGet
-
Pack de langue cherokee ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗZip NuGet
-
Pack de langue cyrillique Scripts cyrilliquesZip NuGet
-
Pack linguistique Divehi ދިވެހިZip NuGet
-
Pack de langue Dzongkha རྫོང་ཁZip NuGet
-
Pack de langue féroïen føroysktZip NuGet
-
Pack de langue filipino Les PhilippinesZip NuGet
-
Pack de langue financière Feuilles de calcul & NombresZip NuGet
-
Pack de Langue Fraktur Fraktur GénériqueZip NuGet
-
Pack de langue francique FrenkiskZip NuGet
-
Pack de langue Hangul Alphabet HangulZip NuGet
-
Pack de Langue Inuktitut ᐃᓄᒃᑎᑐᑦZip NuGet
-
Pack de langue javanais basa JawaZip NuGet
-
Pack de Langue Malais bahasa MelayuZip NuGet
-
Pack de langue Malayalam മലയാളംZip NuGet
-
Pack de langue maorie te reo MāoriZip NuGet
-
Pack de langue MICR Reconnaissance de caractères à encre magnétiqueZip NuGet
-
Pack de Langue Anglais Moyen Anglais (1100-1500 ap. J.-C.)Zip NuGet
-
Middle French Language Pack Moyen FrançaisZip NuGet
-
Pack de langue Myanmar BirmanZip NuGet
-
Pack de langue Kurde du Nord KurmanjiZip NuGet
-
Pack de Langue Occitan occitanZip NuGet
-
Pack de langue quechua Runa SimiZip NuGet
-
Pack de Langue Sanskrit संस्कृतम्Zip NuGet
-
Pack de langue syriaque SyrienZip NuGet
-
Pack de langue tibétain Tibétain standardZip NuGet
-
Pack de langue Tonga faka TongaZip NuGet
- Pack de langue Yoruba YorùbáZip NuGet
Aide
Si la langue que vous souhaitez lire ne figure pas dans la liste ci-dessus, veuillez nous contacter. De nombreuses autres langues sont disponibles sur demande.
La priorité sur les ressources de production est donnée aux titulaires de licence IronOCR. Veuillez donc envisager d'acquérir une licence pour IronOCR afin d'accéder au pack linguistique de votre choix.