Traitement des zéros barrés dans IronOCR
Les zéros barrés ne sont pas reconnus correctement, ils sont identifiés comme g, 6 ou 8 ?
Il peut s'agir d'un problème avec les packs linguistiques de Tesseract.
Le pack linguistique suivant peut aider à résoudre ce problème avec des zéros barrés :
https://github.com/yusufuyanik1/SlashedZeroOCR
Elle peut ensuite être utilisée avec la fonction IronOCR pour charger des packs de langues personnalisés :
https://ironsoftware.com/csharp/ocr/languages/#custom-language-example
using IronOcr; var Ocr = new IronTesseract();
Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var Input = new OcrInput(@"images\image.png"))
{
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr; var Ocr = new IronTesseract();
Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
using (var Input = new OcrInput(@"images\image.png"))
{
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata")
Using Input = New OcrInput("images\image.png")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using