Extracción de texto desde una imagen usando software de aprendizaje automático
La extracción de texto de imágenes textuales capturadas o documentos escaneados utilizando aprendizaje automático es un campo en auge en la intersección de la visión por computadora y el procesamiento del lenguaje natural. Esta tecnología aprovecha el aprendizaje automático avanzado, algoritmos de reconocimiento de objetos, software de gráficos avanzados, web profunda y oscura, y arquitecturas de redes neuronales para identificar y extraer con precisión información textual de imágenes y documentos en papel escaneados. Al emplear diversas tecnologías de aprendizaje automático, como el reconocimiento óptico de caracteres (OCR) y el aprendizaje profundo, permite la conversión automatizada y eficiente de detección de texto en escenas visuales en datos estructurados editables y buscables allí y detección de objetos.
En este panorama en evolución, los investigadores y profesionales se esfuerzan continuamente por mejorar la precisión, velocidad y versatilidad, haciendo que la detección y extracción de texto de imágenes, datos legibles por máquina y documentos escaneados sea un componente crucial en aplicaciones como la digitalización de documentos impresos, la indexación de contenido, la traducción y la mejora de la accesibilidad.
En este artículo, discutiremos cómo puedes extraer texto de imágenes usando IronOCR, una biblioteca OCR potenciada por algoritmos de aprendizaje automático potentes y características relacionadas con el texto. La extracción de texto, también conocida como extracción de palabras clave, se basa en el aprendizaje automático para escanear automáticamente y extraer palabras relevantes o básicas y frases de datos no estructurados o de la base de datos central de la empresa.
¿Cómo extraer texto de una imagen usando aprendizaje automático?
- Descarga la librería de C# para la extracción de texto de imágenes.
- Carga una imagen en particular instanciando el objeto OcrInput para el reconocimiento de texto en la escena.
- Extrae datos de la imagen usando el método ocrTesseract.Read.
- Imprime el texto extraído en la consola usando el método Console.WriteLine.
- Realiza OCR en la región de una imagen usando el objeto CropRectangle.
IronOCR: una biblioteca de OCR (reconocimiento óptico de caracteres)
IronOCR, un software sofisticado y destacado de reconocimiento óptico de caracteres (OCR), se sitúa a la vanguardia de la tecnología de extracción de texto de imágenes y documentos. Desarrollado por Iron Software, este potente motor OCR está diseñado para convertir con precisión y eficacia imágenes escaneadas, PDFs o incluso fotografías de texto en contenido digital editable y buscable. Con su uso hábil de algoritmos de aprendizaje automático y redes neuronales, IronOCR ofrece una solución robusta para varias aplicaciones, incluyendo extracción de datos, indexación de contenido y procesos de automatización que requieren reconocimiento de texto preciso.
Su capacidad para manejar múltiples idiomas y fuentes diversas lo convierte en una herramienta versátil tanto para desarrolladores como para empresas que buscan capacidades de extracción de algoritmos de reconocimiento de texto eficientes en su software y aplicaciones. Puedes usar IronOCR para escanear texto automáticamente utilizando una técnica común de reconocimiento de texto que convierte datos no estructurados en una página perfectamente escaneada utilizando algoritmos de extracción de texto.
Instalación de IronOCR
IronOCR puede ser instalado usando el Administrador de Paquetes NuGet. Aquí están los pasos para instalar IronOCR:
- Primero, crea un nuevo proyecto de Visual Studio en C# o abre uno existente.

- Una vez que se ha creado el proyecto, dirígete a Herramientas en el menú superior y selecciona Administrador de Paquetes NuGet, luego selecciona el Administrador de Paquetes NuGet para Solución.

- Aparecerá una nueva ventana en la pantalla. Ve a la pestaña Examinar y escribe IronOCR en la barra de búsqueda.
- Aparecerá una lista de paquetes de IronOCR. Selecciona el más reciente y haz clic en instalar.

- Tomará unos segundos según tu conexión a internet; después de eso, IronOCR estará listo para ser utilizado en tu proyecto de C#.
Detección de texto desde imágenes a datos editables y buscables
Usando IronOCR, puedes fácilmente extraer texto utilizando técnicas de procesamiento de imágenes y aprendizaje automático. En esta sección, discutiremos cómo extraer texto de imágenes usando IronOCR.
using IronOcr;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}using IronOcr;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}Imports IronOcr
Imports System
' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()
' Specify the image path and perform OCR on the image
Using ocrInput As New OcrInput("images\image.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Print the extracted text to the console
Console.WriteLine(ocrResult.Text)
End UsingEste código en C# demuestra el uso de IronOCR, una biblioteca para el reconocimiento óptico de caracteres (OCR). Aquí está una explicación paso a paso:
Importación de Bibliotecas:
using IronOcr; using System;using IronOcr; using System;Imports IronOcr Imports System$vbLabelText $csharpLabelEl código comienza importando las bibliotecas necesarias, incluyendo IronOcr, que proporciona la funcionalidad de OCR, y el espacio de nombres System para funcionalidades generales.
Inicializando IronTesseract y Cargando la Imagen:
var ocrTesseract = new IronTesseract();var ocrTesseract = new IronTesseract();IRON VB CONVERTER ERROR developers@ironsoftware.com$vbLabelText $csharpLabelEsta línea crea una instancia de IronTesseract, que es el motor OCR proporcionado por IronOCR.
using (var ocrInput = new OcrInput(@"images\image.png"))using (var ocrInput = new OcrInput(@"images\image.png"))Using ocrInput As New OcrInput("images\image.png")$vbLabelText $csharpLabelSe instancia un objeto OcrInput con la ruta a la imagen que debe ser procesada. En este caso, el archivo de imagen es "image.png" en el directorio "images".
Realizando OCR y Extrayendo Texto:
var ocrResult = ocrTesseract.Read(ocrInput);var ocrResult = ocrTesseract.Read(ocrInput);IRON VB CONVERTER ERROR developers@ironsoftware.com$vbLabelText $csharpLabelEsta línea invoca el método Read de la instancia de IronTesseract, haciendo referencia al objeto OcrInput. Este método realiza OCR en la imagen proporcionada y extrae el texto.
Mostrando el Texto Extraído:
Console.WriteLine(ocrResult.Text);Console.WriteLine(ocrResult.Text);Console.WriteLine(ocrResult.Text)$vbLabelText $csharpLabelFinalmente, el texto extraído se imprime en la consola usando Console.WriteLine, mostrando el resultado de OCR obtenido de la imagen.
Este fragmento de código utiliza IronOCR para realizar OCR en el reconocimiento de texto de la imagen especificada y muestra el texto extraído en la consola.
Imagen de entrada

Resultado

Realizar OCR en la región especificada de la imagen
También puedes realizar OCR en regiones específicas de la imagen usando IronOCR. Aquí hay un ejemplo de código:
using IronOcr;
using IronSoftware.Drawing;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
// Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea);
// Perform OCR on the specified region and extract text
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}using IronOcr;
using IronSoftware.Drawing;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
// Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea);
// Perform OCR on the specified region and extract text
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}Imports IronOcr
Imports IronSoftware.Drawing
Imports System
' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()
' Specify the region on the image to be processed
Using ocrInput As New OcrInput()
Dim ContentArea = New CropRectangle(x:= 20, y:= 20, width:= 400, height:= 50)
' Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea)
' Perform OCR on the specified region and extract text
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Print the extracted text to the console
Console.WriteLine(ocrResult.Text)
End UsingEste código en C# utiliza la biblioteca IronOCR para reconocimiento óptico de caracteres (OCR). Primero importa las bibliotecas necesarias, incluyendo IronOCR y System. Se crea una instancia de IronTesseract, el motor de OCR. El código establece un área de contenido específica en la imagen a ser procesada usando un CropRectangle, enfocándose en una región definida. La imagen ("r3.png") dentro de esta área designada se agrega para el procesamiento de OCR. El motor de OCR lee el área de contenido especificada, extrae el texto, y el texto resultante se imprime en la consola usando Console.WriteLine.
Resultado

Conclusión
La extracción de texto de imágenes a través del aprendizaje automático, utilizando notablemente bibliotecas de reconocimiento óptico de caracteres (OCR) como IronOCR, significa un paso transformador en el cruce de la visión por computadora y el procesamiento del lenguaje natural. Tanto la tecnología OCR como las técnicas de aprendizaje profundo juegan un papel fundamental en la conversión eficiente de texto visual en datos editables y buscables, sirviendo propósitos vitales como la digitalización de documentos, la indexación de contenido y la mejora de la accesibilidad.
IronOCR, como una biblioteca OCR destacada, ejemplifica el potencial de esta fusión, sobresaliendo en la conversión precisa de imágenes escaneadas y PDFs en contenido digital editable a través de múltiples idiomas y estilos de fuente. Su integración perfecta en lenguajes de programación como C# permite una implementación simplificada, amplificando aún más el impacto transformador de la extracción de texto de imágenes en numerosas aplicaciones y dominios.
Para saber más sobre IronOCR y todas las características relacionadas visita este enlace aquí. El tutorial completo sobre la extracción de texto de imágenes está disponible en el siguiente enlace. La licencia de IronOCR se puede comprar desde este enlace.