Extracción de texto de una imagen mediante software de aprendizaje automático
La extracción de texto a partir de imágenes textuales capturadas o documentos escaneados mediante aprendizaje automático es un campo floreciente en la intersección de la visión por ordenador y el procesamiento del lenguaje natural. Esta tecnología aprovecha el aprendizaje automático avanzado, los algoritmos de reconocimiento de objetos, el software gráfico avanzado, la web profunda y oscura y las arquitecturas de redes neuronales para identificar y extraer con precisión información textual de imágenes y documentos en papel escaneados, desde notas manuscritas y texto impreso hasta tipografía compleja en diversos contextos. Mediante el empleo de diversas tecnologías de aprendizaje automático, como el reconocimiento óptico de caracteres(OCR) y el aprendizaje profundo, permite convertir de forma automatizada y eficiente la detección de texto de escenas visuales en datos estructurados editables y con capacidad de búsqueda en ellas y la detección de objetos.
En este panorama en constante evolución, investigadores y profesionales se esfuerzan continuamente por mejorar la precisión, la velocidad y la versatilidad, haciendo de la detección y extracción de texto a partir de imágenes, datos legibles por máquina y documentos escaneados un componente fundamental en aplicaciones como la digitalización de documentos impresos, la indexación de contenidos, la traducción y la mejora de la accesibilidad.
En este artículo, vamos a discutir cómo se puede extraer texto de imágenes utilizandoIronOCRuna biblioteca de OCR basada en potentes algoritmos de aprendizaje automático y funciones relacionadas con el texto. La extracción de texto, también conocida como extracción de palabras clave, se basa en el aprendizaje automático para escanear y extraer automáticamente palabras y frases relevantes o básicas de datos no estructurados o de la base de datos central de la empresa.
¿Cómo extraer texto de una imagen mediante aprendizaje automático?
Descargue la biblioteca C# para la extracción de texto de imágenes.
Carga una imagen concreta instanciando el objeto OcrInput para el reconocimiento de texto en escena.
Extraer datos de la imagen utilizando el método ocrTesseract.Read.
Imprime el texto extraído en la consola utilizando el método Console.WriteLine.
- Realiza OCR en la región de una imagen utilizando el objeto CropRectangle.**
IronOCR- Biblioteca OCR (Reconocimiento Óptico de Caracteres)
IronOCR, un destacado y sofisticado reconocimiento óptico de caracteres(OCR) está a la vanguardia de la tecnología de extracción de texto de imágenes y documentos. Desarrollado por Iron Software, este potente motor de OCR está diseñado para convertir con precisión y eficacia imágenes escaneadas, PDF o incluso fotografías de texto en contenido digital editable y con capacidad de búsqueda. Con su uso experto de algoritmos de aprendizaje automático y redes neuronales, IronOCR proporciona una solución sólida para diversas aplicaciones, como la extracción de datos, la indexación de contenidos y los procesos de automatización que requieren un reconocimiento preciso del texto.
Su capacidad para manejar varios idiomas y diversos tipos de letra lo convierte en una herramienta versátil tanto para desarrolladores como para empresas que buscan capacidades de extracción de algoritmos de reconocimiento de texto racionalizados en su software y aplicaciones. Puede utilizar IronOCR para escanear texto automáticamente mediante una técnica común de reconocimiento de texto que convierte los datos no estructurados en una página perfectamente escaneada utilizando algoritmos de extracción de texto.
Instalación de IronOCR
IronOCR se puede instalar utilizando NuGet Package Manager, aquí están los pasos para instalar IronOCR.
En primer lugar, cree un nuevo proyecto de C# Visual Studio o abra uno existente.
Una vez creado el proyecto, vaya a Herramientas en el menú superior y seleccione Gestor de paquetes NuGet y, a continuación, seleccione el Gestor de paquetes NuGet para la solución.
Aparecerá una nueva ventana en la pantalla. Vaya a la pestaña Examinar y escriba IronOCR en la barra de búsqueda.
Aparecerá una lista de paquetes IronOCR, seleccione el más reciente y haga clic en instalar.
- Tardará unos segundos, dependiendo de su conexión a Internet, después de lo cual IronOCR estará listo para ser utilizado en su proyecto C#.
Detección de texto de imágenes en datos editables y buscables
Con IronOCR puede extraer fácilmente el texto utilizando técnicas de procesamiento de imágenes y aprendizaje automático. En esta sección, discutiremos cómo extraer texto de imágenes usando IronOCR.
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput("images\image.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
Este código C# demuestra el uso de IronOCR, una biblioteca para el reconocimiento óptico de caracteres(OCR). Aquí tienes una explicación paso a paso:
- Importación de bibliotecas:
utilizando IronOcr;
usando System;
El código comienza importando las librerías necesarias, incluyendo **IronOcr**, que proporciona la funcionalidad OCR, y el espacio de nombres **System** para funcionalidades generales.
2. **Inicialización de IronTesseract y carga de la imagen**:
var ocrTesseract = nuevo IronTesseract();
Esta línea crea una instancia de **IronTesseract**, que es el motor OCR proporcionado por IronOCR.
```cs
using (var ocrInput = new OcrInput(@"images\image.png"))
Se instancia un objeto OcrInput con la ruta de la imagen a procesar. En este caso, el archivo de imagen es "image.png" en el directorio "images".
- Realización de OCR y extracción de texto:
var ocrResult = ocrTesseract.Read(ocrInput);
Esta línea invoca el método **Read** de la instancia **IronTesseract**, pasando el objeto **OcrInput**. Este método realiza un OCR en la imagen proporcionada y extrae el texto.
4. **Visualización del texto extraído**:
Console.WriteLine(ocrResult.Text);
Finalmente, el texto extraído se imprime en la consola mediante **Console.WriteLine**, mostrando el resultado del OCR obtenido de la imagen.
Este fragmento de código utiliza IronOCR para realizar el reconocimiento óptico de caracteres del texto de la imagen especificada y envía el texto extraído a la consola.
### Imagen de entrada
![Factura](/static-assets/ironsoftware/white-papers/text-extraction-from-image-using-machine-learning/text-extraction-from-image-using-machine-learning-4.webp)
### Salida
![Emisión de facturas de clientes](/static-assets/ironsoftware/white-papers/text-extraction-from-image-using-machine-learning/text-extraction-from-image-using-machine-learning-5.webp)
### Realizar OCR en la región especificada de la imagen
También puede realizar OCR en regiones específicas de la imagen utilizando IronOCR, aquí hay un ejemplo de código.
utilizando IronOcr;
usando IronSoftware.Drawing;
usando System;
var ocrTesseract = nuevo IronTesseract();
utilizando(var ocrInput = nuevo OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, ancho: 400, alto: 50);
ocrInput.AddImage("r3.png", Área de contenido);
var ocrResult = ocrTesseract.Read(ocrInput);
Consola.WriteLine(ocrResult.Text);
}
Este código C# utiliza la biblioteca IronOCR para el reconocimiento óptico de caracteres(OCR). Primero importa las bibliotecas necesarias, incluidas IronOCR y System. Se crea una instancia de IronTesseract, el motor de OCR. El código establece un ContentArea específico en la imagen para ser procesado usando un CropRectangle, centrándose en una región definida. La imagen("r3.png") dentro de esta área designada se añade para el procesamiento OCR. El motor de OCR lee el área de contenido especificada, extrae el texto y el texto resultante se imprime en la consola mediante Console.WriteLine.
### Salida
![Salida](/static-assets/ironsoftware/white-papers/text-extraction-from-image-using-machine-learning/text-extraction-from-image-using-machine-learning-6.webp)
## Conclusión
Extracción de texto a partir de imágenes mediante aprendizaje automático, en particular empleando el reconocimiento óptico de caracteres.(OCR) como IronOCR, supone un paso transformador en la encrucijada de la visión por ordenador y el procesamiento del lenguaje natural. Esta tecnología, basada en avanzados algoritmos de aprendizaje automático y redes neuronales, descifra y extrae con precisión texto de diversos tipos de imágenes, como escritura a mano, texto impreso y tipografía compleja. Tanto la tecnología de reconocimiento óptico de caracteres como las técnicas de aprendizaje profundo desempeñan un papel fundamental en la conversión eficiente de texto visual en datos editables y con capacidad de búsqueda, con fines vitales como la digitalización de documentos, la indexación de contenidos y la mejora de la accesibilidad.
IronOCR, como destacada biblioteca de OCR, ejemplifica el potencial de esta fusión, destacando en la conversión precisa de imágenes escaneadas y PDF en contenido digital editable en múltiples idiomas y estilos de fuente. Su perfecta integración en lenguajes de programación como C# permite una implementación simplificada, lo que amplifica aún más el impacto transformador de la extracción de texto de imágenes en numerosas aplicaciones y dominios.
Para saber más sobre[IronOCR](https://ironsoftware.com/csharp/ocr/) y todas las funciones relacionadas visite este enlace[aquí](https://ironsoftware.com/csharp/ocr/features/). El tutorial completo sobre la extracción de texto de imágenes está disponible en[enlace](https://ironsoftware.com/csharp/ocr/tutorials/how-to-read-text-from-an-image-in-csharp-net/). La licencia de IronOCR puede adquirirse en[enlace](https://ironsoftware.com/csharp/ocr/licensing/).
Software de tramitación de siniestros de seguros de vida
Software de impresión de entradas para eventos