Französische OCR in C# und .NET
Andere Versionen dieses Dokuments:
IronOCR ist eine C#-Komposition, mit der C#-Programmierer Texte anhand von Bildern und Grafiken lesen können documents PDF en 126 langues, dont le français.
Es handelt sich um einen weiterentwickelten Tesseract-Fork, der ausschließlich für .NET-Entwickler konzipiert wurde und die Erwartungen übertrifft régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.
Inhalt von IronOcr.Languages.French
Dieses Paket enthält 43 OCR-Sprachen für .NET:
- français
- Französisch
- Französisch rapide
Télécharger
Pack de langue française [français]
* Herunterladen als Zip *: français
* Installieren mit https://www.nuget.org/packages/IronOcr.Languages.French/'> NuGet
Einrichtung
Die erste Entscheidung, die wir treffen sollten, ist die Installation unseres OCR-Pakets français dans votre projet .NET.
PM> Install-Package IronOCR.Languages.French
Beispiel für einen Code
Dieses Code-Beispiel in C# beleuchtet den französischen Text anhand eines Bildes oder eines PDF-Dokuments.
//PM> Install-Package IronOcr.Languages.French
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput(@"images\French.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.French
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput(@"images\French.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.French
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using Input = New OcrInput("images\French.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
Warum sollten Sie IronOCR wählen?
IronOCR ist eine einfach zu installierende, vollständige und gut dokumentierte Logikbibliothek für .NET.
Wählen Sie IronOCR, um eine Antwort zu erhalten genauigkeit von 99,8% + OCR ohne Inanspruchnahme von Web-Diensten externes, de frais courants ou d'envoyer des documents confidentiels sur Internet.
Warum haben die C#-Entwickler IronOCR und nicht Vanilla Tesseract gewählt?
- Installer en tant que DLL ou NuGet unique
- Die Geräte Tesseract 5, 4 und 3 sind für den Einsatz vorbereitet.
- Die Genauigkeit 99,8% übertrifft den Tesseract régulier um ein Vielfaches.
- Maximale Geschwindigkeit und Multithreading
- Kompatibel mit MVC, WebApp, Büro, Konsole und Anwendungsservierer
- Aucun code Exes ou C ++ avec lequel travailler
- Vollständige Kontrolle von OCR PDF
- Zur Durchführung von OCR für nahezu jede Bild- oder PDF-Datei
- Vollständige Einführung von .NET Core, Standard und FrameWork
- Einsatz unter Windows, Mac, Linux, Azure, Docker, Lambda, AWS
- Lesen Sie die Barcodes und QR-Codes
- Exporter l'OCR en XHTML
- Exporter l'OCR vers des documents PDF interrogeables
- Leitung von Multithreading
- 126 internationale Sprachen, die über NuGet- oder OcrData-Dateien bereitgestellt werden
- Extraire des images, des coordonnées, des statistiques et des polices. Nicht nur der Text.
- Kann für die Weiterverteilung von Tesseract OCR in kommerziellen und eigenen Anwendungen verwendet werden.
IronOCR brennt, wenn Sie mit aktuellen Bildern und unvollständigen Dokumenten arbeiten, wie z.B fotografien oder Digitalisate mit geringer Auflösung, die numerische Fehler oder Schäden verursachen können imperfections.
Andere Bibliotheken OCR-Gratifikationen für die Plattenform .NET, wie auch andere Web-APIs und -Dienste, funktionieren in diesen Fällen nicht so gut wie in anderen Fällen d'utilisation réels.
OCR mit Tesseract 5 - Codierung in C# beginnen
Das folgende Code-Beispiel zeigt, wie einfach es ist, einen Text anhand eines Bildes zu lesen l'aide de C#ou VB .NET.
Bonmot
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
Hello World konfigurierbar
// PM> Install-Package IronOCR.Languages.French
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... vous pouvez ajouter n'importe quel nombre d'images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.French
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... vous pouvez ajouter n'importe quel nombre d'images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.French
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR C#PDF
Die gleiche Methode kann auch verwendet werden, um den Text eines beliebigen PDF-Dokuments zu extrahieren.
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Nous pouvons également sélectionner des numéros de page PDF spécifiques à l'OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 page pour chaque page du PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Nous pouvons également sélectionner des numéros de page PDF spécifiques à l'OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 page pour chaque page du PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Nous pouvons également sélectionner des numéros de page PDF spécifiques à l'OCR
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 page pour chaque page du PDF
End Using
OCR für TIFF MultiPage
OCR-Vortrag im TIFF-Format, einschließlich mehrseitiger Dokumente Das TIFF-Format kann auch als converti directement en un fichier PDF avec un texte interrogeable.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Strich- und QR-Codes
Eine einzigartige Eigenschaft von IronOCR ist, dass es Barcodes und QR-Codes von Dokumenten lesen kann pendant qu'il numérise du texte. Les instances de la classe OcrResult.OcrBarcode
fournissent au développeur des informations détaillées sur chaque code-barres numérisé.
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// propriétés de type et d'emplacement également exposées
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// propriétés de type et d'emplacement également exposées
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' propriétés de type et d'emplacement également exposées
Next Barcode
End Using
OCR für bestimmte Bildbereiche
Alle Digitalisierungs- und Vorlesungsmethoden von IronOCR bieten die Möglichkeit, die Art der Anwendung genau zu spezifizieren teil der oder der Seiten, von denen aus wir den Text lesen wollen. Ceci est très utile lorsque nous examinons des formulaires standardisés et peut gagner énormément de temps et améliorer l'efficacité.
Für die Nutzung der kartierten Regionen müssen wir ein Referenzsystem hinzufügen, das System.Zeichnung
afin de pouvoir utiliser l'objet System.Drawing.Rectangle
.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Les dimensions sont en px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Les dimensions sont en px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' Les dimensions sont en px
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR für Zahlen mit geringer Qualität
La classe IronOCR OcrInput
kann die Scans korrigieren, die von Tesseract normal nicht gelesen werden können.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // corrige le bruit numérique et une mauvaise numérisation
Input.Deskew(); // corrige la rotation et la perspective
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // corrige le bruit numérique et une mauvaise numérisation
Input.Deskew(); // corrige la rotation et la perspective
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' corrige le bruit numérique et une mauvaise numérisation
Input.Deskew() ' corrige la rotation et la perspective
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Exportieren der OCR-Ergebnisse in Form einer interoperablen PDF-Datei
Bild im PDF-Format mit kopierbaren Textpassagen. Kann über die Forschungseinrichtungen und Datenbanken indexiert werden de données.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
Konvertierung von TIFF in PDF mit Recherche
COnversez un document TIFF (oder eine ganze Gruppe von Bilddateien) direkt in ein interrogierbares PDF-Format umgewandelt werden, das indexé par les moteurs de recherche intranet, site Web et Google.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
OCR-Resultate im HTML-Format exportieren
Umwandlung von OCR-Bildern in XHTML.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
Filtres d'amélioration de l'image OCR
IronOCR bietet einheitliche Filter für die Objekte OcrInput
zur Verbesserung der Leistungen von l'OCR.
Beispiel für einen Code zur Bildverbesserung
Geben Sie OCR-Bilder in hoher Qualität wieder, um schnellere und bessere OCR-Ergebnisse zu erzielen.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // corrige le bruit numérique et une mauvaise numérisation
Input.Deskew(); // corrige la rotation et la perspective
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // corrige le bruit numérique et une mauvaise numérisation
Input.Deskew(); // corrige la rotation et la perspective
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' corrige le bruit numérique et une mauvaise numérisation
Input.Deskew() ' corrige la rotation et la perspective
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Liste der OCR-Bildfilter
Die in IronOCR integrierten Filter zur Verbesserung der OCR-Leistung sind ebenfalls enthalten:
- OcrInput.Rotate (doppelabschlüsse) - Fait pivoter les images d'un certain nombre de degrés im Sinne von "aiguilles d'une montre". Pour le sens anti-horaire, utilisez des nombres négatifs.
- OcrInput.Binarize () - Ce filtre d'image transforme chaque pixel en noir ou blanc sans milieu. Kann die Leistung der OCR in Fällen mit sehr geringem Kontrast zwischen Text und Bild verbessern l'arrière-plan.
- OcrInput.ToGrayScale () - Ce filtre d'image transforme chaque pixel en une nuance de gris. Peu susceptible d'améliorer la précision de l'OCR mais peut améliorer la vitesse
- OcrInput.Contrast () - Augmente automatiquement le contraste. Dieser Filter verbessert häufig die vitesse et la précision de l'OCR dans les numérisations à faible contraste.
- OcrInput.DeNoise () - Supprime le bruit numérique. Ce filtre ne doit être utilisé que là où du bruit est attendu.
- OcrInput.Invert () - Inverse chaque couleur. Par exemple, le blanc devient noir: le noir devient blanc.
- OcrInput.Dilate () - Morphologie avancée. La Dilatation hinzufügen von Pixeln zu Begrenzungen von Objekten in einem Bild. Face à Erode
- OcrInput.Erode () - Morphologie avancée. L'érosion unterdrückt die Pixel auf den limites des objets
- OcrInput.Deskew () - Fait pivoter une image pour qu'elle soit dans le bon sens et orthogonal. Dies ist für die OCR sehr nützlich, da die Tesseract-Toleranz für asymmetrische Zahlen gilt peut être aussi basse que 5 degrés.
- OcrInput.DeepCleanBackgroundNoise () - Unterdrückung du bruit de fond lourd. N'utilisez ce filtre que dans le cas où un bruit de fond extrême du document est connu, car ce filtre risque également de réduire la précision de l'OCR des documents propres et est très coûteux en CPU.
- OcrInput.EnhanceResolution - Verbessert die Auflösung von Bildern mit geringer Qualität. Ce filtre n'est pas souvent nécessaire car OcrInput.MinimumDPI und OcrInput.TargundDPI captureront und résoudront automatiquement les entrées basse résolution.
CleanBackgroundNoise. C'est un paramètre qui prend un peu de temps; darüber hinaus ermöglicht er die bibliothèque de nettoyer automatiquement le bruit numérique, les froissements de papier et d'autres unzulänglichkeiten in einem digitalen Bild, die auch dazu führen, dass es von anderen nicht mehr gelesen werden kann bibliothèques OCR.
EnhanceContrast ist ein Parameter, der IronOCR dazu zwingt, automatisch den Kontrast der text im Verhältnis zum Grundriss eines Bildes, was die Genauigkeit der OCR erhöht und die généralement les performances et la vitesse de l'OCR.
EnhanceResolution ist ein Parameter, der automatisch die niedrigste Bildauflösung ermittelt (kleiner als 275 dpi) et met automatiquement à l'échelle l'image, puis accentue tout le texte afin qu'il puisse être lu parfaitement par une bibliothèque OCR. Auch wenn es sich um eine eigene Operation handelt chronophage, elle réduit généralement le temps global d'une opération OCR sur une image.
Langue IronOCR verfügt über 22 internationale Sprachmodule und den Parameter für die Sprache peut être utilisé pour sélectionner une ou plusieurs langues à appliquer pour une opération OCR.
Stratégie IronOCR setzt auf zwei Strategien. Wir können wählen, ob wir uns für eine eine schnelle und weniger präzise Nummerierung eines Dokuments, oder die Verwendung einer fortschrittlichen Strategie, die die bestimmte Modelle künstlicher Intelligenz zur automatischen Verbesserung der OCR-Textgenauigkeit untersuchung der statistischen Beziehung zwischen den Wörtern eines Satzes. .
Farbraum ist ein Parameter, mit dem wir die Erkennung auswählen können optique de caractères en niveaux de gris ou en couleur. Im Allgemeinen ist die graue Stufe die beste option. Allerdings kann es vorkommen, dass Texte oder Grundrisse mit ähnlichem Aufbau, aber in anderer Farbe, vorhanden sind très différente, un espace colorimétrique en couleur donnera de meilleurs résultats.
DetectWhiteTextOnDarkBackgrounds. Generell gilt für alle OCR-Bibliotheken, dass sie sich um du texte noir sur fond blanc. Dieser Parameter ermöglicht IronOCR die automatische Erkennung von Negativlisten oder Seiten sombres avec du texte blanc et de les lire.
EingabeBildTyp. Dieser Parameter ermöglicht es dem Entwickler, die OCR-Bibliothèque zu steuern, um zu wissen, ob elle regarde un document complet ou un extrait de code, comme une capture d'écran.
RotateAndStraighten ist ein fortschrittlicher Parameter, der dem IronOCR die einzigartige Fähigkeit verleiht, die dokumente, die nicht nur drehbar sind, sondern auch eine Perspektive enthalten, wie z.B. Fotografien de documents texte.
ReadBarcodes ist eine nützliche Funktion, die es dem IronOCR ermöglicht, automatisch die Codes zu lesen barres et les codes QR sur les pages tout en lisant également le texte, sans ajouter de temps supplémentaire.
La profondeur de la couleur. Dieser Parameter legt die Anzahl der Bits pro Pixel fest, die die Bibliothek OCR dient zur Bestimmung des Farbtons einer Farbe. Eine höhere Farbintensität kann die Wirkung von la qualité de l'OCR, mais augmentera également le temps nécessaire à l'exécution de l'OCR.
126 Sprachpakete
IronOCR prend en charge 126 internationale Sprachen über die sprachlichen Module, die in Form von DLL verteilt werden, die sich als die über diese Website abgerufen werden können Web oder auch auf der Grundlage von gestionnaire de packages NuGet .
Les langues comprennent l'allemand, le français, l'anglais, le chinois, le japonais et bien d'autres. Es gibt spezielle Sprachpakete für die MRZ-Pässe, die MICR-Tickets, die Finanzdokumente und die plaques d'immatriculation et bien d'autres. Sie können auch eine beliebige Datei verwenden tesseract ".traineddata", y compris ceux que vous créez vous-même.
Beispiel für eine Sprache
Verwendung anderer OCR-Sprachen.
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Ajoutez des filtres d'image si nécessaire
// Dans ce cas, même si l'entrée est de très mauvaise qualité
// IronTesseract peut lire ce que le Tesseract conventionnel ne peut pas.
var Result = Ocr.Read(input);
// La console ne peut pas imprimer facilement l'arabe sous Windows.
// Sauvegardons plutôt sur le disque.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Ajoutez des filtres d'image si nécessaire
// Dans ce cas, même si l'entrée est de très mauvaise qualité
// IronTesseract peut lire ce que le Tesseract conventionnel ne peut pas.
var Result = Ocr.Read(input);
// La console ne peut pas imprimer facilement l'arabe sous Windows.
// Sauvegardons plutôt sur le disque.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Ajoutez des filtres d'image si nécessaire
' Dans ce cas, même si l'entrée est de très mauvaise qualité
' IronTesseract peut lire ce que le Tesseract conventionnel ne peut pas.
Dim Result = Ocr.Read(input)
' La console ne peut pas imprimer facilement l'arabe sous Windows.
' Sauvegardons plutôt sur le disque.
Result.SaveAsTextFile("arabic.txt")
End Using
Exemple de plusieurs langues
Es ist auch möglich, die OCR in mehreren Sprachen gleichzeitig zu nutzen. Das kann wirklich so sein aider à obtenir des métadonnées et des URL en anglais dans les documents Unicode.
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.French);
// Nous pouvons ajouter n'importe quel nombre de langues
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.French);
// Nous pouvons ajouter n'importe quel nombre de langues
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.French)
' Nous pouvons ajouter n'importe quel nombre de langues
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
Objekte mit OCR-Resultaten in der Tabelle
IronOCR liefert für jede OCR-Operation ein OCR-Resultat. Im Allgemeinen verwenden die Entwickler nur den Text des Objekts, um den nummerierten Text auf der Grundlage des Bildes zu erhalten. Cependant, le DOM des résultats OCR est beaucoup plus avancé que cela.
using IronOcr;
using System.Drawing; //Ajouter une référence d'assemblage
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Important
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Explorez ici pour trouver une API massive et détaillée:
// - Pages, blocs, paraphaphes, lignes, mots, caractères
// - Exportation d'images, coordonnées des polices, données statistiques
}
using IronOcr;
using System.Drawing; //Ajouter une référence d'assemblage
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.French;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Important
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Explorez ici pour trouver une API massive et détaillée:
// - Pages, blocs, paraphaphes, lignes, mots, caractères
// - Exportation d'images, coordonnées des polices, données statistiques
}
Imports IronOcr
Imports System.Drawing 'Ajouter une référence d'assemblage
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.French
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '!Important
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' Explorez ici pour trouver une API massive et détaillée:
' - Pages, blocs, paraphaphes, lignes, mots, caractères
' - Exportation d'images, coordonnées des polices, données statistiques
End Using
Leistung
IronOCR funktioniert auch außerhalb des Computers, ohne dass die Leistung oder die Bilder stark verändert werden müssen d'entrée.
La vitesse est fulgurante: IronOcr.2020 + est jusqu'à 10 fois plus rapide et fait plus de 250% d'erreurs en moins que les versions précédentes.
Mehr lernen und mehr erfahren
Wenn Sie mehr über OCR in C#, VB, F# oder einer anderen .NET-Sprache wissen möchten, klicken Sie bitte hier lire nos didacticiels communautaires , qui donnent des exemples concrets de la façon dont IronOCR peut être utilisé et peuvent montrer les nuances sur la façon de tirer le meilleur parti de cette bibliothèque.
Une referenz des Objekts vollständig für die Entwickler von .NET steht ebenfalls zur Verfügung.