LIBROS BLANCOS

Extracción de texto de una imagen mediante software de aprendizaje automático

28 de febrero, 2023

TECNOLOGíA

La extracción de texto a partir de imágenes textuales capturadas o documentos escaneados mediante aprendizaje automático es un campo floreciente en la intersección de la visión por ordenador y el procesamiento del lenguaje natural. Esta tecnología utiliza aprendizaje automático avanzado, algoritmos de reconocimiento de objetos, software gráfico avanzado, la web profunda y oscura, y arquitecturas de redes neuronales para identificar y extraer con precisión información textual de imágenes y documentos escaneados en papel. Al emplear varias tecnologías de aprendizaje automático, como el reconocimiento óptico de caracteres (OCR) y el aprendizaje profundo, permite la conversión automatizada y eficiente de la detección de texto de escena visual en datos estructurados editables y buscables y la detección de objetos.

En este panorama en constante evolución, investigadores y profesionales se esfuerzan continuamente por mejorar la precisión, la velocidad y la versatilidad, haciendo de la detección y extracción de texto a partir de imágenes, datos legibles por máquina y documentos escaneados un componente fundamental en aplicaciones como la digitalización de documentos impresos, la indexación de contenidos, la traducción y la mejora de la accesibilidad.

En este artículo, discutiremos cómo puedes extraer texto de imágenes usando IronOCR, una biblioteca OCR impulsada por potentes algoritmos de aprendizaje automático y características relacionadas con el texto. La extracción de texto, también conocida como extracción de palabras clave, se basa en el aprendizaje automático para escanear y extraer automáticamente palabras relevantes o básicas y frases de datos no estructurados o de la base de datos central de la empresa.

¿Cómo extraer texto de una imagen mediante aprendizaje automático?

Descargue la biblioteca C# para la extracción de texto de imágenes.
Cargue una imagen particular instanciando el objeto OcrInput para el reconocimiento de texto en la escena.
Extraer datos de la imagen utilizando el método ocrTesseract.Read.
Imprima el texto extraído en la consola usando el método Console.WriteLine.
Realice OCR en la región de una imagen utilizando el objeto CropRectangle**.**

IronOCR- Biblioteca OCR (Reconocimiento Óptico de Caracteres)

IronOCR, un destacado y sofisticado software de reconocimiento óptico de caracteres (OCR), se encuentra a la vanguardia de la tecnología de extracción de texto de imágenes y documentos. Desarrollado por Iron Software, este potente motor de OCR está diseñado para convertir con precisión y eficacia imágenes escaneadas, PDF o incluso fotografías de texto en contenido digital editable y con capacidad de búsqueda. Con su uso experto de algoritmos de aprendizaje automático y redes neuronales, IronOCR proporciona una solución sólida para diversas aplicaciones, como la extracción de datos, la indexación de contenidos y los procesos de automatización que requieren un reconocimiento preciso del texto.

Su capacidad para manejar varios idiomas y diversos tipos de letra lo convierte en una herramienta versátil tanto para desarrolladores como para empresas que buscan capacidades de extracción de algoritmos de reconocimiento de texto racionalizados en su software y aplicaciones. Puede utilizar IronOCR para escanear texto automáticamente mediante una técnica común de reconocimiento de texto que convierte los datos no estructurados en una página perfectamente escaneada utilizando algoritmos de extracción de texto.

Instalación de IronOCR

IronOCR se puede instalar utilizando NuGet Package Manager, aquí están los pasos para instalar IronOCR.

En primer lugar, cree un nuevo proyecto de C# Visual Studio o abra uno existente.
Una vez creado el proyecto, vaya a Herramientas en el menú superior y seleccione Gestor de paquetes NuGet y, a continuación, seleccione el Gestor de paquetes NuGet para la solución.
Aparecerá una nueva ventana en la pantalla. Vaya a la pestaña Examinar y escriba IronOCR en la barra de búsqueda.
Aparecerá una lista de paquetes IronOCR, seleccione el más reciente y haga clic en instalar.
Tardará unos segundos, dependiendo de su conexión a Internet, después de lo cual IronOCR estará listo para ser utilizado en su proyecto C#.

Detección de texto de imágenes en datos editables y buscables

Con IronOCR puede extraer fácilmente el texto utilizando técnicas de procesamiento de imágenes y aprendizaje automático. En esta sección, discutiremos cómo extraer texto de imágenes usando IronOCR.

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput("images\image.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using

$vbLabelText $csharpLabel

Este código C# demuestra el uso de IronOCR, una biblioteca para reconocimiento óptico de caracteres (OCR). Aquí tienes una explicación paso a paso:

Importación de bibliotecas:

    using IronOcr; 
    using System;

    using IronOcr; 
    using System;

Imports IronOcr
	Imports System

$vbLabelText $csharpLabel

El código comienza importando las bibliotecas necesarias, incluyendo IronOcr, que proporciona la funcionalidad de OCR, y el espacio de nombres System para funcionalidades generales.

Inicialización de IronTesseract y Carga de la Imagen:

    var ocrTesseract = new IronTesseract();

    var ocrTesseract = new IronTesseract();

IRON VB CONVERTER ERROR developers@ironsoftware.com

$vbLabelText $csharpLabel

Esta línea crea una instancia de IronTesseract, que es el motor OCR proporcionado por IronOCR.

    using (var ocrInput = new OcrInput(@"images\image.png"))

    using (var ocrInput = new OcrInput(@"images\image.png"))

Using ocrInput As New OcrInput("images\image.png")

$vbLabelText $csharpLabel

Se instancia un objeto OcrInput con la ruta de la imagen que se va a procesar. En este caso, el archivo de imagen es "image.png" en el directorio "images".

Realizar OCR y extraer texto:

    var ocrResult = ocrTesseract.Read(ocrInput);

    var ocrResult = ocrTesseract.Read(ocrInput);

IRON VB CONVERTER ERROR developers@ironsoftware.com

$vbLabelText $csharpLabel

Esta línea invoca el método Read de la instancia IronTesseract, pasando el objeto OcrInput. Este método realiza un OCR en la imagen proporcionada y extrae el texto.

Mostrando el Texto Extraído:

    Console.WriteLine(ocrResult.Text);

    Console.WriteLine(ocrResult.Text);

Console.WriteLine(ocrResult.Text)

$vbLabelText $csharpLabel

Finalmente, el texto extraído se imprime en la consola utilizando Console.WriteLine, mostrando el resultado de OCR obtenido de la imagen.

Este fragmento de código utiliza IronOCR para realizar el reconocimiento óptico de caracteres del texto de la imagen especificada y envía el texto extraído a la consola.

Imagen de entrada

Factura

Salida

Output de Factura al Cliente

Realizar OCR en la región especificada de la imagen

También puede realizar OCR en regiones específicas de la imagen utilizando IronOCR, aquí hay un ejemplo de código.

using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
    ocrInput.AddImage("r3.png", ContentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
    ocrInput.AddImage("r3.png", ContentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
	Dim ContentArea = New CropRectangle(x:= 20, y:= 20, width:= 400, height:= 50)
	ocrInput.AddImage("r3.png", ContentArea)
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using

$vbLabelText $csharpLabel

Este código C# utiliza la biblioteca IronOCR para el reconocimiento óptico de caracteres (OCR). Primero importa las bibliotecas necesarias, incluidas IronOCR y System. Se crea una instancia de IronTesseract, el motor de OCR. El código establece un ContentArea específico en la imagen para ser procesado usando un CropRectangle, centrándose en una región definida. La imagen ("r3.png") dentro de esta área designada se añade para el procesamiento OCR. El motor de OCR lee el área de contenido especificada, extrae el texto y el texto resultante se imprime en la consola mediante Console.WriteLine.

Salida

Conclusión

La extracción de texto de imágenes a través del aprendizaje automático, empleando notablemente bibliotecas de reconocimiento óptico de caracteres (OCR) como IronOCR, representa un avance transformador en la intersección de la visión por computadora y el procesamiento del lenguaje natural. Tanto la tecnología de reconocimiento óptico de caracteres como las técnicas de aprendizaje profundo desempeñan un papel fundamental en la conversión eficiente de texto visual en datos editables y con capacidad de búsqueda, con fines vitales como la digitalización de documentos, la indexación de contenidos y la mejora de la accesibilidad.

IronOCR, como destacada biblioteca de OCR, ejemplifica el potencial de esta fusión, destacando en la conversión precisa de imágenes escaneadas y PDF en contenido digital editable en múltiples idiomas y estilos de fuente. Su perfecta integración en lenguajes de programación como C# permite una implementación simplificada, lo que amplifica aún más el impacto transformador de la extracción de texto de imágenes en numerosas aplicaciones y dominios.

Para saber más sobre IronOCR y todas las funciones relacionadas, visite este enlace aquí. El tutorial completo sobre cómo extraer texto de imágenes está disponible en el siguiente enlace. La licencia de IronOCR se puede comprar desde este enlace.

< ANTERIOR
Software de tramitación de siniestros de seguros de vida

SIGUIENTE >
Software de impresión de entradas para eventos