LIBROS BLANCOS

Extracción de texto de una imagen mediante software de aprendizaje automático

Actualizado 28 de febrero, 2023
TECNOLOGíA
Compartir:

La extracción de texto a partir de imágenes textuales capturadas o documentos escaneados mediante aprendizaje automático es un campo floreciente en la intersección de la visión por ordenador y el procesamiento del lenguaje natural. Esta tecnología aprovecha el aprendizaje automático avanzado, los algoritmos de reconocimiento de objetos, el software gráfico avanzado, la web profunda y oscura y las arquitecturas de redes neuronales para identificar y extraer con precisión información textual de imágenes y documentos en papel escaneados, desde notas manuscritas y texto impreso hasta tipografía compleja en diversos contextos. Mediante el empleo de diversas tecnologías de aprendizaje automático, como el reconocimiento óptico de caracteres(OCR) y el aprendizaje profundo, permite convertir de forma automatizada y eficiente la detección de texto de escenas visuales en datos estructurados editables y con capacidad de búsqueda en ellas y la detección de objetos.

En este panorama en constante evolución, investigadores y profesionales se esfuerzan continuamente por mejorar la precisión, la velocidad y la versatilidad, haciendo de la detección y extracción de texto a partir de imágenes, datos legibles por máquina y documentos escaneados un componente fundamental en aplicaciones como la digitalización de documentos impresos, la indexación de contenidos, la traducción y la mejora de la accesibilidad.

En este artículo, vamos a discutir cómo se puede extraer texto de imágenes utilizando IronOCRuna biblioteca de OCR basada en potentes algoritmos de aprendizaje automático y funciones relacionadas con el texto. La extracción de texto, también conocida como extracción de palabras clave, se basa en el aprendizaje automático para escanear y extraer automáticamente palabras y frases relevantes o básicas de datos no estructurados o de la base de datos central de la empresa.

¿Cómo extraer texto de una imagen mediante aprendizaje automático?

  1. Descargue la biblioteca C# para la extracción de texto de imágenes.
  2. Carga una imagen concreta instanciando el objeto OcrInput para el reconocimiento de texto en escena.
  3. Extraer datos de la imagen utilizando el método ocrTesseract.Read.
  4. Imprime el texto extraído en la consola utilizando el método Console.WriteLine.
  5. Realiza OCR en la región de una imagen utilizando el objeto CropRectangle.**

IronOCR- Biblioteca OCR (Reconocimiento Óptico de Caracteres)

IronOCR, un destacado y sofisticado reconocimiento óptico de caracteres(OCR) está a la vanguardia de la tecnología de extracción de texto de imágenes y documentos. Desarrollado por Iron Software, este potente motor de OCR está diseñado para convertir con precisión y eficacia imágenes escaneadas, PDF o incluso fotografías de texto en contenido digital editable y con capacidad de búsqueda. Con su uso experto de algoritmos de aprendizaje automático y redes neuronales, IronOCR proporciona una solución sólida para diversas aplicaciones, como la extracción de datos, la indexación de contenidos y los procesos de automatización que requieren un reconocimiento preciso del texto.

Su capacidad para manejar varios idiomas y diversos tipos de letra lo convierte en una herramienta versátil tanto para desarrolladores como para empresas que buscan capacidades de extracción de algoritmos de reconocimiento de texto racionalizados en su software y aplicaciones. Puede utilizar IronOCR para escanear texto automáticamente mediante una técnica común de reconocimiento de texto que convierte los datos no estructurados en una página perfectamente escaneada utilizando algoritmos de extracción de texto.

Instalación de IronOCR

IronOCR se puede instalar utilizando NuGet Package Manager, aquí están los pasos para instalar IronOCR.

  1. En primer lugar, cree un nuevo proyecto de C# Visual Studio o abra uno existente.

    Visual Studio

  2. Una vez creado el proyecto, vaya a Herramientas en el menú superior y seleccione Gestor de paquetes NuGet y, a continuación, seleccione el Gestor de paquetes NuGet para la solución.

    Menú Herramientas

  3. Aparecerá una nueva ventana en la pantalla. Vaya a la pestaña Examinar y escriba IronOCR en la barra de búsqueda.
  4. Aparecerá una lista de paquetes IronOCR, seleccione el más reciente y haga clic en instalar.

    IronOCR

  5. Tardará unos segundos, dependiendo de su conexión a Internet, después de lo cual IronOCR estará listo para ser utilizado en su proyecto C#.

Detección de texto de imágenes en datos editables y buscables

Con IronOCR puede extraer fácilmente el texto utilizando técnicas de procesamiento de imágenes y aprendizaje automático. En esta sección, discutiremos cómo extraer texto de imágenes usando IronOCR.

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput("images\image.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
VB   C#

Este código C# demuestra el uso de IronOCR, una biblioteca para el reconocimiento óptico de caracteres(OCR). Aquí tienes una explicación paso a paso:

  1. Importación de bibliotecas:

    using IronOcr; 
    using System;
    using IronOcr; 
    using System;
    IRON VB CONVERTER ERROR developers@ironsoftware.com
    VB   C#

    El código comienza importando las librerías necesarias, incluyendo IronOcr, que proporciona la funcionalidad OCR, y el espacio de nombres System para funcionalidades generales.

  2. Inicialización de IronTesseract y carga de la imagen:

    var ocrTesseract = new IronTesseract();
    var ocrTesseract = new IronTesseract();
    IRON VB CONVERTER ERROR developers@ironsoftware.com
    VB   C#

    Esta línea crea una instancia de IronTesseract, que es el motor OCR proporcionado por IronOCR.

    var ocrResult = ocrTesseract.Read(ocrInput);
    var ocrResult = ocrTesseract.Read(ocrInput);
    IRON VB CONVERTER ERROR developers@ironsoftware.com
    VB   C#

    Se instancia un objeto OcrInput con la ruta de la imagen a procesar. En este caso, el archivo de imagen es "image.png" en el directorio "images".

  3. Realización de OCR y extracción de texto:

    Console.WriteLine(ocrResult.Text);
    Console.WriteLine(ocrResult.Text);
    Console.WriteLine(ocrResult.Text)
    VB   C#

    Esta línea invoca el método Read de la instancia IronTesseract, pasando el objeto OcrInput. Este método realiza un OCR en la imagen proporcionada y extrae el texto.

  4. Visualización del texto extraído:

    Console.WriteLine(ocrResult.Text);
    Console.WriteLine(ocrResult.Text);
    Console.WriteLine(ocrResult.Text)
    VB   C#

    Finalmente, el texto extraído se imprime en la consola mediante Console.WriteLine, mostrando el resultado del OCR obtenido de la imagen.

    Este fragmento de código utiliza IronOCR para realizar el reconocimiento óptico de caracteres del texto de la imagen especificada y envía el texto extraído a la consola.

Imagen de entrada

Factura

Salida

Emisión de facturas de clientes

Realizar OCR en la región especificada de la imagen

También puede realizar OCR en regiones específicas de la imagen utilizando IronOCR, aquí hay un ejemplo de código.

using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
    ocrInput.AddImage("r3.png", ContentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
    ocrInput.AddImage("r3.png", ContentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
	Dim ContentArea = New CropRectangle(x:= 20, y:= 20, width:= 400, height:= 50)
	ocrInput.AddImage("r3.png", ContentArea)
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
VB   C#

Este código C# utiliza la biblioteca IronOCR para el reconocimiento óptico de caracteres(OCR). Primero importa las bibliotecas necesarias, incluidas IronOCR y System. Se crea una instancia de IronTesseract, el motor de OCR. El código establece un ContentArea específico en la imagen para ser procesado usando un CropRectangle, centrándose en una región definida. La imagen("r3.png") dentro de esta área designada se añade para el procesamiento OCR. El motor de OCR lee el área de contenido especificada, extrae el texto y el texto resultante se imprime en la consola mediante Console.WriteLine.

Salida

Salida

Conclusión

Extracción de texto a partir de imágenes mediante aprendizaje automático, en particular empleando el reconocimiento óptico de caracteres.(OCR) como IronOCR, supone un paso transformador en la encrucijada de la visión por ordenador y el procesamiento del lenguaje natural. Esta tecnología, basada en avanzados algoritmos de aprendizaje automático y redes neuronales, descifra y extrae con precisión texto de diversos tipos de imágenes, como escritura a mano, texto impreso y tipografía compleja. Tanto la tecnología de reconocimiento óptico de caracteres como las técnicas de aprendizaje profundo desempeñan un papel fundamental en la conversión eficiente de texto visual en datos editables y con capacidad de búsqueda, con fines vitales como la digitalización de documentos, la indexación de contenidos y la mejora de la accesibilidad.

IronOCR, como destacada biblioteca de OCR, ejemplifica el potencial de esta fusión, destacando en la conversión precisa de imágenes escaneadas y PDF en contenido digital editable en múltiples idiomas y estilos de fuente. Su perfecta integración en lenguajes de programación como C# permite una implementación simplificada, lo que amplifica aún más el impacto transformador de la extracción de texto de imágenes en numerosas aplicaciones y dominios.

Para saber más sobre IronOCR y todas las funciones relacionadas visite este enlace aquí. El tutorial completo sobre la extracción de texto de imágenes está disponible en enlace. La licencia de IronOCR puede adquirirse en enlace.

< ANTERIOR
Software de tramitación de siniestros de seguros de vida
SIGUIENTE >
Software de impresión de entradas para eventos

Consigue tu libro blanco gratuito

Gracias,

El correo electrónico con el enlace de descarga le será enviado en breve.