OCR auf Spanisch in C#y .NET
Weitere Versionen dieses Dokuments:
IronOCR ist eine C#-Softwarekomponente, die es den Entwicklern von .NET ermöglicht, Bildtexte und PDF-Dokumente zu lesen en 126 idiomas, incluido el español.
Es handelt sich um eine moderne Abspaltung von Tesseract, die ausschließlich für Entwickler von .NET und regulären Anwendungen entwickelt wurde supera a otros motores Tesseract tanto en velocidad como en precisión.
Inhalte von IronOcr Idiomas Español
Dieses Paket enthält 99 OCR-Identitäten für .NET:
- Español
- EspañolMejor
- Español rápido
- EspañolAntiguo
- EspañolOldMejor
- EspañolAntiguo Rápido
Descargar
Paket mit Sprachkenntnissen español [español]
* Herunterladen als Código Postal
* Installieren mit https://www.nuget.org/packages/IronOcr.Languages.Spanish/'> NuGet
Instalación
Als erstes müssen wir unser OCR-Paket in der Datenbank installieren español in ihrem .NET-Projekt.
PM> Install-Package IronOCR.Languages.Spanish
Beispiel für einen Code
Dieses C#-Beispiel zeigt den Text in Spanisch in einem Bild- oder PDF-Dokument.
//PM> Install-Package IronOcr.Languages.Spanish
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput(@"images\Spanish.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Spanish
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput(@"images\Spanish.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Spanish
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using Input = New OcrInput("images\Spanish.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
weshalb IronOCR wählen?
IronOCR ist eine einfach zu installierende, vollständige und gut dokumentierte Softwarebibliothek für .NET.
Elija IronOCR para lograr una oCR-Genauigkeit übergeordnete al 99,8% sin utilizar ningún servicio web externo, tarifas continuas o enviar documentos confidenciales por Internet.
Warum haben die Entwickler von C# IronOCR anstelle von Vanilla Tesseract gewählt?
- Installation als eine einzelne DLL oder NuGet
- Inklusive für die Motoren Tesseract 5, 4 und 3 außerhalb des Gehäuses.
- Die Genauigkeit 99,8% supera significativamente al Tesseract normal.
- Höchste Geschwindigkeit und Vielseitigkeit
- Kompatibel mit MVC, WebApp, Tastatur, Konsole und Serveranwendung
- Sin código Exes o C ++ para trabajar
- Komplettes PDF OCR-Angebot
- Für OCR in jedem Bild- oder PDF-Archiv
- Komplette Unterstützung für .NET Core, Standard und FrameWork
- Implementieren unter Windows, Mac, Linux, Azure, Docker, Lambda, AWS
- Barrieren und QR-Zeichensätze leeren
- OCR als XHTML exportieren
- Exportieren von OCR in PDF-Dokumente mit Suchfunktion
- Unterstützung von mehreren Teilprozessen
- 126 internationale Sprachen, die alle über NuGet- und OcrData-Archive verwaltet werden
- Extrae imágenes, coordenadas, estadísticas y fuentes. No solo mensajes de texto.
- Se puede utilizar para redistribuir Tesseract OCR dentro de aplicaciones comerciales y patentadas.
IronOCR glänzt bei der Arbeit mit realen Bildern und unvollkommenen Dokumenten wie Fotos oder escaneos de baja resolución que pueden tener imperfecciones o ruido digital.
Andere Biblioteken der OCR kostenlos für die .NET-Plattform, wie zum Beispiel otras API y servicios web de .net tesseract, no funcionan tan bien en estos casos de uso del mundo real.
OCR mit Tesseract 5: Kodierung in C# möglich
Das folgende Beispiel zeigt, wie einfach es ist, mit C# und VB .NET den Text eines Bildes zu lesen.
Un trazador de líneas
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
Hola mundo konfigurierbar
// PM> Install-Package IronOCR.Languages.Spanish
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... puedes agregar cualquier cantidad de imágenes
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Spanish
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... puedes agregar cualquier cantidad de imágenes
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Spanish
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
C#PDF OCR
Die gleiche Methode kann in ähnlicher Weise für das Extrahieren von Text aus einem beliebigen PDF-Dokument verwendet werden.
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// También podemos seleccionar números de página PDF específicos para OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 página por cada página del PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// También podemos seleccionar números de página PDF específicos para OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 página por cada página del PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' También podemos seleccionar números de página PDF específicos para OCR
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 página por cada página del PDF
End Using
OCR für TIFF von mehreren Seiten
Lectura OCR Formato de archivo TIFF que incluye documentos de varias páginas. TIFF kann auch konvertiert werden directamente en un archivo PDF con texto de búsqueda.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Barriere- und QR-Zeichen
Eine Besonderheit von IronOCR ist, dass Sie bei der Suche nach Dokumenten sowohl Barcodes als auch QR-Codes lesen können texto. Die Unterrichtseinheiten OcrResult.OcrBarcode
dem Entwickler detaillierte Informationen zur Verfügung stellen sobre cada código de barras escaneado.
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// propiedades de tipo y ubicación también expuestas
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// propiedades de tipo y ubicación también expuestas
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' propiedades de tipo y ubicación también expuestas
Next Barcode
End Using
OCR in speziellen Bildbereichen
Alle Vorlesungs- und Bewertungsmethoden des IronOCR bieten die Möglichkeit, genau zu bestimmen, welcher Teil des una página o páginas deseamos leer el texto. Dies ist sehr nützlich, wenn wir Standardformulare suchen und kann ahorrar una gran cantidad de tiempo y mejorar la eficiencia.
Für die Verwendung von Aufzeichnungsregionen müssen wir eine Systemreferenz hinzufügen System.Zeichnung
para que podamos usar el objeto System.Drawing.Rectangle
.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Las dimensiones están en px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Las dimensiones están en px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' Las dimensiones están en px
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR für Hochglanzbilder von geringer Qualität
Die Klasse IronOCR OcrInput
sie können Texte korrigieren, die Tesseract normal nicht lesen kann.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // corrige el ruido digital y el escaneo deficiente
Input.Deskew(); // corrige la rotación y la perspectiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // corrige el ruido digital y el escaneo deficiente
Input.Deskew(); // corrige la rotación y la perspectiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' corrige el ruido digital y el escaneo deficiente
Input.Deskew() ' corrige la rotación y la perspectiva
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Exportieren von OCR-Ergebnissen im PDF-Format mit Suchfunktion
Bilder im PDF-Format mit kopierbaren Textpassagen. Puede ser indexado por motores de búsqueda y bases de datos.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
Konvertierung von TIFF in PDF mit Suchfunktion
Konvertiert ein Dokument in ein TIFF-Format (oder eine beliebige Gruppe von Bildarchiven) direkt in eine PDF-Datei mit der Möglichkeit der búsqueda que se puede indexar mediante intranet, sitio web y motores de búsqueda de Google.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
OCR-Ergebnisse im HTML-Format exportieren
Konvertierung von OCR-Bildern in XHTML.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
Filtros zur Bildverbesserung OCR
IronOCR bietet spezielle Filter für Objekte an OcrInput
zur Verbesserung des OCR-Ergebnisses.
Beispiel für einen Bildverbesserungscode
Die OCR-Eingabebilder müssen von höchster Qualität sein, um bessere und schnellere OCR-Ergebnisse zu erzielen.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // corrige el ruido digital y el escaneo deficiente
Input.Deskew(); // corrige la rotación y la perspectiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // corrige el ruido digital y el escaneo deficiente
Input.Deskew(); // corrige la rotación y la perspectiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' corrige el ruido digital y el escaneo deficiente
Input.Deskew() ' corrige la rotación y la perspectiva
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Liste der Bildfilter für OCR
Zu den in IronOCR integrierten Eingangsfiltern zur Verbesserung der OCR-Leistung gehören:
- OcrInput.Rotate (grados dobles) : gira las imágenes varios grados en el sentido de las agujas del reloj. En sentido antihorario, utilice números negativos.
- OcrInput.Binarize () : este filtro de imagen convierte cada píxel en blanco o negro sin término medio. Puede mejorar el rendimiento de OCR en casos de muy bajo contraste de texto con el fondo.
- OcrInput.ToGrayScale () : este filtro de imagen convierte cada píxel en una sombra de escala de grises. Es poco probable que mejore la precisión del OCR, pero puede mejorar la velocidad
- OcrInput.Contrast () : aumenta el contraste automáticamente. Dieses Filtriergerät vergrößert die velocidad y precisión de OCR en escaneos de bajo contraste.
- OcrInput.DeNoise () : elimina el ruido digital. Este filtro solo debe usarse donde se espere ruido.
- OcrInput.Invert () : invierte todos los colores. Zum Beispiel wird aus "blanco" "negro": "el negro se vuelve blanco.
- OcrInput.Dilate () - Morfología avanzada. Die Dilatation die Grenzwerte zu unterschreiten de los objetos en una imagen. Frente a erosionar
- OcrInput.Erode () - Morfología avanzada. La erosión beseitigt die Píxeles in den límites de los objetos Opuesto a Dilate
- OcrInput.Deskew () : gira una imagen para que esté en la posición correcta hacia arriba y ortogonal. Dies ist für die OCR sehr nützlich, da die Toleranz von Tesseract für gesättigte Bögen so gering sein kann como 5 grados.
- OcrInput.DeepCleanBackgroundNoise () - Eliminación de ruido de fondo intenso. Utilice este filtro solo en caso de que se conozca un ruido de fondo extremo en los documentos, ya que este filtro también correrá el riesgo de reducir la precisión del OCR de los documentos limpios y es muy costoso para la CPU.
- OcrInput.EnhanceResolution : Verbessert die Auflösung von Bildern geringer Qualität. Dieses Filtriergerät ist nicht se necesita a menudo porque OcrInput.MinimumDPI y OcrInput.TargetDPI capturarán y resolverán automáticamente las entradas de baja resolución.
CleanBackgroundNoise. Este es un escenario que requiere algo de tiempo; sin embargo, permite que la biblioteca löscht automatisch den digitalen Schmutz, die Papierfalten und andere Mängel innerhalb einer Bibliothek imagen digital que de otro modo la harían incapaz de ser leída por otras bibliotecas de OCR.
EnhanceContrast ist eine Konfiguration, die bewirkt, dass IronOCR automatisch das Kontrastverhältnis der texto con el fondo de una imagen, aumentando la precisión del OCR y, en general, aumentando el rendimiento y la velocidad del OCR.
EnhanceResolution es handelt sich um eine Konfiguration, die automatisch Bilder mit geringer Auflösung erkennt (die weniger als 275 ppp betragen) und verbessert automatisch das Bild, und danach wird der gesamte Text verbessert, so dass Sie die Möglichkeit haben ser leído perfectamente por una biblioteca de OCR. Auch wenn diese Operation selbst viel Zeit in Anspruch nimmt, generalmente reduce el tiempo total para una operación de OCR en una imagen.
Sprache IronOCR lässt 22 internationale Sprachpakete zu, und die Sprachkonfiguration kann puede utilizar para seleccionar uno o más idiomas múltiples que se aplicarán a una operación de OCR.
Estrategia IronOCR gibt zwei Strategien zu. Wir können uns für ein schnelles und weniger genaues Escaneo entscheiden ein Dokument oder die Anwendung einer modernen Strategie, die einige künstliche Intelligenzmodelle zur Verbesserung der automatisch die Genauigkeit der OCR-Texterkennung, indem sie den zeitlichen Zusammenhang zwischen den einzelnen Wörtern in einem Dokument beobachtet oración. .
Farbraum es una configuración mediante la cual podemos elegir OCR en escala de grises o en color. In der Regel ist die Graustufenskala die beste Wahl. Sin embargo, a veces, cuando hay textos o fondos de tono similar pero de color muy diferente, un espacio de color a todo color proporcionará mejores resultados.
DetectWhiteTextOnDarkBackgrounds. Im Allgemeinen erwarten alle OCR-Bibliotheken die Verifizierung von Text negro sobre fondos blancos. Diese Konfiguration ermöglicht es IronOCR, automatisch negative Dokumente oder Seiten zu erkennen oscuras con texto blanco y las lea.
EingabeBildTyp. Diese Konfiguration ermöglicht es dem Entwickler, die OCR-Bibliotek so auszurichten, dass sie está viendo un documento completo o un fragmento, como una captura de pantalla.
RotateAndStraighten es handelt sich um eine fortschrittliche Konfiguration, die IronOCR die einmalige Fähigkeit verleiht, zu lesen dokumente, die nicht nur gedreht sind, sondern auch perspektivische Aufnahmen enthalten, wie z. B. Fotos von Dokumenten, die texto.
ReadBarcodes ist eine nützliche Funktion, die es dem IronOCR ermöglicht, automatisch Barcodes und códigos QR en las páginas, ya que también lee texto, sin agregar una gran carga de tiempo adicional.
Profundität der Farbe. Diese Konfiguration bestimmt, wie viele Bits pro Sekunde die Bibliothek verwendet de OCR para determinar la profundidad de un color. Eine größere Farbtiefe kann die Qualität der OCR verbessern, pero también aumentará el tiempo necesario para que se complete la operación de OCR.
126 Pakete mit Sprachen
IronOCR zugeben 126 idiomas internacionales a mit Hilfe von Sprachpaketen, die wie folgt verteilt werden archivos DLL, que se pueden descargar von dieser Website o también desde NuGet-Paketmanager .
Los idiomas incluyen alemán, francés, inglés, chino, japonés y muchos más. Existen paquetes de idiomas spezialisiert auf Pasaportes MRZ, MICR-Schecks, Finanzdaten, Rechnungen und vieles mehr. También puede utilizar cualquier archivo tesseract ".traineddata", incluidos los que cree usted mismo.
Beispiel für eine Sprache
Verwendung von OCR in anderen Idiomen.
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Agregue filtros de imagen si es necesario
// En este caso, incluso la entrada de pensamiento es de muy baja calidad.
// IronTesseract puede leer lo que el Tesseract convencional no puede.
var Result = Ocr.Read(input);
// La consola no puede imprimir árabe en Windows fácilmente.
// En su lugar, guardemos en disco.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Agregue filtros de imagen si es necesario
// En este caso, incluso la entrada de pensamiento es de muy baja calidad.
// IronTesseract puede leer lo que el Tesseract convencional no puede.
var Result = Ocr.Read(input);
// La consola no puede imprimir árabe en Windows fácilmente.
// En su lugar, guardemos en disco.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Agregue filtros de imagen si es necesario
' En este caso, incluso la entrada de pensamiento es de muy baja calidad.
' IronTesseract puede leer lo que el Tesseract convencional no puede.
Dim Result = Ocr.Read(input)
' La consola no puede imprimir árabe en Windows fácilmente.
' En su lugar, guardemos en disco.
Result.SaveAsTextFile("arabic.txt")
End Using
Beispiel für verschiedene Sprachen
Es ist auch möglich, die OCR in mehreren Sprachen gleichzeitig durchzuführen. Esto realmente puede ayudar a obtener metadatos y URL en inglés en documentos Unicode.
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Spanish);
// Podemos agregar cualquier número de idiomas
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Spanish);
// Podemos agregar cualquier número de idiomas
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Spanish)
' Podemos agregar cualquier número de idiomas
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
Detaillierte OCR-Resultate
IronOCR liefert für jede OCR-Operation ein OCR-Ergebnisobjekt. Im Allgemeinen sind die Desarrolladores allein verwenden Sie den Text des Objekts, um den Text des Bildes zu scannen. Dennoch ist der DOM de resultados de OCR es mucho más avanzado que esto.
using IronOcr;
using System.Drawing; //Agregar referencia de ensamblaje
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Importante
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Explore aquí para encontrar una API masiva y detallada:
// - Páginas, Bloques, Paraphaphs, Líneas, Palabras, Caracteres
// - Exportación de imágenes, coordenadas de fuentes, datos estadísticos
}
using IronOcr;
using System.Drawing; //Agregar referencia de ensamblaje
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Spanish;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Importante
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Explore aquí para encontrar una API masiva y detallada:
// - Páginas, Bloques, Paraphaphs, Líneas, Palabras, Caracteres
// - Exportación de imágenes, coordenadas de fuentes, datos estadísticos
}
Imports IronOcr
Imports System.Drawing 'Agregar referencia de ensamblaje
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Spanish
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '!Importante
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' Explore aquí para encontrar una API masiva y detallada:
' - Páginas, Bloques, Paraphaphs, Líneas, Palabras, Caracteres
' - Exportación de imágenes, coordenadas de fuentes, datos estadísticos
End Using
Actuación
IronOCR funktioniert sofort, ohne dass eine Anpassung der Leistung oder eine weitgehende Änderung der Bilddaten erforderlich ist entrada.
Die Geschwindigkeit ist unschlagbar: IronOcr.2020 + ist bis zu 10 Mal schneller und hat 250 % weniger Fehler als die versiones anteriores.
Mehr erfahren
Weitere Informationen über OCR in C#, VB, F# oder einer anderen .NET-Sprache finden Sie unter lea nuestros tutoriales de la comunidad , que brindan ejemplos del mundo real de cómo se puede usar IronOCR y pueden mostrar los matices de cómo aprovechar al máximo esta biblioteca.
También está disponible una referenz des Objekts vollständig para desarrolladores .NET .