using IronOcr; using IronSoftware.Drawing; // Podemos profundizar en los resultados del OCR como un modelo de objeto de // Páginas, códigos de barras, párrafos, líneas, palabras y caracteres // Esto nos permite explorar, exportar y dibujar contenidos OCR utilizando otras API/ var ocrTesseract = new IronTesseract(); ocrTesseract.Configuration.ReadBarCodes = true; using var ocrInput = new OcrInput(); var pages = new int[] { 1, 2 }; ocrInput.LoadImageFrames("example.tiff", pages); OcrResult ocrResult = ocrTesseract.Read(ocrInput); foreach (var page in ocrResult.Pages) { // Página objeto int PageNumber = page.PageNumber; string PageText = page.Text; int PageWordCount = page.WordCount; // null si no establecemos Ocr.Configuration.ReadBarCodes = true; OcrResult.Barcode[] Barcodes = page.Barcodes; AnyBitmap PageImage = page.ToBitmap(ocrInput); int PageWidth = page.Width; int PageHeight = page.Height; double PageRotation = page.Rotation; // corrección angular en grados de OcrInput.Deskew() foreach (var paragraph in page.Paragraphs) { // Páginas -> Párrafos int ParagraphNumber = paragraph.ParagraphNumber; string ParagraphText = paragraph.Text; AnyBitmap ParagraphImage = paragraph.ToBitmap(ocrInput); int ParagraphX_location = paragraph.X; int ParagraphY_location = paragraph.Y; int ParagraphWidth = paragraph.Width; int ParagraphHeight = paragraph.Height; double ParagraphOcrAccuracy = paragraph.Confidence; OcrResult.TextFlow paragrapthText_direction = paragraph.TextDirection; foreach (var line in paragraph.Lines) { // Páginas -> Párrafos -> Líneas int LineNumber = line.LineNumber; string LineText = line.Text; AnyBitmap LineImage = line.ToBitmap(ocrInput); int LineX_location = line.X; int LineY_location = line.Y; int LineWidth = line.Width; int LineHeight = line.Height; double LineOcrAccuracy = line.Confidence; double LineSkew = line.BaselineAngle; double LineOffset = line.BaselineOffset; foreach (var word in line.Words) { // Páginas -> Párrafos -> Líneas -> Palabras int WordNumber = word.WordNumber; string WordText = word.Text; AnyBitmap WordImage = word.ToBitmap(ocrInput); int WordX_location = word.X; int WordY_location = word.Y; int WordWidth = word.Width; int WordHeight = word.Height; double WordOcrAccuracy = word.Confidence; foreach (var character in word.Characters) { // Páginas -> Párrafos -> Líneas -> Palabras -> Caracteres int CharacterNumber = character.CharacterNumber; string CharacterText = character.Text; AnyBitmap CharacterImage = character.ToBitmap(ocrInput); int CharacterX_location = character.X; int CharacterY_location = character.Y; int CharacterWidth = character.Width; int CharacterHeight = character.Height; double CharacterOcrAccuracy = character.Confidence; // Salida de opciones de símbolos alternativos y su probabilidad. // Muy útil para la corrección ortográfica OcrResult.Choice[] Choices = character.Choices; } } } } }

HERRAMIENTAS OCR

Cómo escanear texto escrito (Tutorial para principiantes)

Actualizado 29 de noviembre, 2023

Introducción

En el mundo de la información digital, la capacidad de convertir la escritura a mano o el texto impreso de documentos escaneados en formatos editables y que permitan realizar búsquedas se ha convertido en algo primordial. Reconocimiento óptico de caracteres (OCR) ha sido clave en este proceso, ya que permite extraer información textual de las imágenes.

En este artículo, exploraremos los fundamentos del Escaneado de escritura a texto mediante Tesseract, un motor de OCR de código abierto, y más adelante presentaremos IronOCR como una potente alternativa con funciones avanzadas para convertir escritura a mano, texto digital y documentos escaneados en texto editable acompañado de un ejemplo de código.

Entender la tecnología OCR

La tecnología OCR utiliza sofisticados algoritmos para reconocer e interpretar los patrones de caracteres impresos o manuscritos dentro de una imagen. En esencia, tiende un puente entre el mundo físico y el digital, permitiéndonos capturar y digitalizar texto de diversas fuentes, como documentos escaneados, escritura manuscrita escaneada, PDF, archivos de imagen escaneados e incluso reconocer la escritura manuscrita.

Tesseract: una solución de OCR de código abierto

Comprender Tesseract

Tesseract desarrollado por Google, es un motor OCR de código abierto muy utilizado para convertir varios tipos de documentos escaneados, como texto manuscrito, imágenes escaneadas y documentos PDF, en texto editable legible por máquina. Es compatible con varios idiomas y ha ganado popularidad por su precisión y versatilidad. Profundicemos en las características clave y los pasos necesarios para utilizar Tesseract para Escanear escritura a texto.

Características principales de Tesseract

Versatilidad: Tesseract admite una amplia gama de formatos de entrada, lo que lo hace adecuado para diversas aplicaciones, incluidos documentos escaneados, imágenes y PDF.
Soporte de idiomas: Tesseract está diseñado para reconocer texto en varios idiomas, lo que lo convierte en una solución flexible para usuarios y desarrolladores internacionales que trabajan con documentos en diferentes contextos lingüísticos.
Comunidad de código abierto: La naturaleza de código abierto de Tesseract ha dado lugar a una sólida comunidad de desarrolladores que contribuyen a su mejora. Las actualizaciones y mejoras periódicas garantizan que Tesseract siga siendo una solución de OCR competitiva.
Precisión de OCR: Tesseract es conocido por su precisión en el reconocimiento de texto, incluso en escenarios complejos con fuentes, estilos y calidades de imagen variables.

Pasos para utilizar Tesseract

Utilizar Tesseract OCR para convertir notas manuscritas o descifrar escritura ilegible en Windows implica unos pocos pasos. He aquí una guía básica:

Instale Tesseract OCR:
- Descarga el instalador de Tesseract para Windows desde el repositorio oficial de GitHub UB Mannheim: Tesseract OCR exe.
- Ejecute el instalador y siga las instrucciones en pantalla para completar la instalación.
- Seleccione la ubicación y recuerde la ruta de instalación, ya que se utilizará más tarde para establecer en la variable Path.
Configurar variables de entorno:
- Añada el directorio de instalación de Tesseract a la variable de entorno PATH del sistema. Esto garantiza que se pueda acceder al ejecutable de Tesseract desde cualquier ventana de símbolo del sistema.
Uso de la línea de comandos:
- Abra una ventana de símbolo del sistema y navegue hasta el directorio que contiene sus imágenes o documentos manuscritos escaneados.
- Utilice el siguiente comando para realizar un OCR en una imagen y enviar el resultado a un archivo de texto:

    tesseract input_image.png output_text.txt

    tesseract input_image.png output_text.txt

'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract input_image.png output_text.txt

VB C#

Sustituya input_image.png por el nombre de su archivo de imagen y output\text.txt por el nombre deseado para el archivo de texto de salida.

Postprocesado: En función de los requisitos, pueden ser necesarios pasos de postprocesamiento para refinar el texto extraído, como la eliminación de caracteres o formatos innecesarios.
Aunque Tesseract es una herramienta potente, los desarrolladores suelen buscar alternativas que ofrezcan funciones adicionales, opciones de personalización y facilidad de integración en sus aplicaciones. Aquí es donde IronOCR entra en juego.

Presentación de IronOCR: Elevación de la escritura escaneada a texto

Comprender IronOCR

IronOCR es una biblioteca OCR .NET que va más allá de las capacidades de Tesseract, ofreciendo funciones avanzadas y opciones de personalización para los desarrolladores. Tanto si trabaja con documentos escaneados, imágenes o PDF escaneados, IronOCR proporciona una solución robusta para la extracción precisa de texto. Exploremos las características clave de IronOCR y cómo puede mejorar el proceso de escaneado de escritura a texto.

Características principales de IronOCR

Precisión: IronOCR aprovecha los algoritmos de OCR más avanzados, lo que garantiza una gran precisión en el reconocimiento de texto. Sobresale en situaciones difíciles, como imágenes de baja calidad o fuentes complejas.
Versatilidad: Al admitir varios formatos de entrada, como imágenes y archivos PDF, IronOCR se adapta a diversos casos de uso, lo que lo convierte en una opción versátil para los desarrolladores.
Compatibilidad lingüística: IronOCR atiende a una audiencia global al soportar múltiples idiomas internacionales, asegurando un procesamiento OCR efectivo para documentos en diferentes contextos lingüísticos.
Facilidad de integración: Una de las características más destacadas de IronOCR es su perfecta integración en las aplicaciones .NET. Los desarrolladores pueden incorporar fácilmente IronOCR a sus proyectos, lo que permite una implementación eficaz de la funcionalidad OCR.

IronOCR: Un ejemplo de código

Hagamos un simple IronTesseract 5 fragmento de código para utilizar IronOCR en una aplicación .NET:

using IronOcr;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

    //  Esto se hace por defecto y puede omitirse:
    //  ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

    using (var ocrInput = new OcrInput(@"images\image.png"))
    {
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
    }
}

using IronOcr;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

    //  Esto se hace por defecto y puede omitirse:
    //  ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

    using (var ocrInput = new OcrInput(@"images\image.png"))
    {
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
    }
}

Imports IronOcr

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()

	'  Esto se hace por defecto y puede omitirse:
	'  ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

	Using ocrInput As New OcrInput("images\image.png")
		Dim ocrResult = ocrTesseract.Read(ocrInput)
		Console.WriteLine(ocrResult.Text)
	End Using
	End Sub
End Class

VB C#

En este ejemplo, IronOCR ofrece un enfoque más directo y orientado a objetos, que permite a los desarrolladores leer texto impreso o manuscrito directamente desde la imagen con el eficaz motor de OCR IronTesseract 5. Para obtener información más detallada, visite la página documentación página.

Conclusión

Aunque Tesseract sigue siendo un sólido motor de OCR de código abierto, IronOCR ofrece funciones mejoradas, opciones de personalización y facilidad de integración para los desarrolladores que trabajan en el ecosistema .NET. La elección entre Tesseract e IronOCR depende de los requisitos específicos del proyecto y del nivel de control deseado sobre el proceso de OCR. A medida que crece la demanda de extracción precisa de texto de documentos escaneados, las herramientas de OCR como IronOCR desempeñan un papel fundamental en la configuración del futuro de la accesibilidad a la información y la gestión de documentos digitales.

IronOCR proporciona un prueba gratuita para que los usuarios experimenten sus capacidades avanzadas de OCR, mientras que un licencia para uso profesional y comercial. Para explorar todo el potencial de IronOCR, descargue la biblioteca de software directamente de la página sitio web oficial.

< ANTERIOR
Reconocimiento de textos en árabe (Herramientas gratuitas y en línea)

SIGUIENTE >
Cómo crear un OCR en Python