USO DE IRONOCR

OCR con visión por ordenador (ejemplo de tutorial)

Actualizado 28 de marzo, 2023
Compartir:

Reconocimiento óptico de caracteres (OCR) es una tecnología que permite a las máquinas leer e interpretar texto a partir de imágenes, con lo que el tratamiento de datos y la automatización resultan más rápidos y eficaces. Este artículo proporciona directrices sobre el uso de la visión por ordenador OCR con la biblioteca IronOCR y cómo puede mejorar el reconocimiento de texto, automatizando este proceso.

¿Por qué es importante el OCR?

OCR junto con visión por ordenador es una forma avanzada de reconocimiento óptico de caracteres (OCR) que aprovecha la potencia de la inteligencia artificial y los algoritmos de aprendizaje automático para reconocer caracteres de texto a partir de imágenes con mayor precisión y eficacia.

Los algoritmos de procesamiento de imágenes por visión informática permiten a los sistemas de OCR comprender el contexto y la disposición del texto en una imagen y reconocer los caracteres basándose en su forma y estructura. El OCR, junto con la visión por ordenador, puede extraer texto de imágenes complejas con múltiples fuentes, estilos y tamaños, lo que lo convierte en una valiosa herramienta para la digitalización de documentos, la extracción de datos y la automatización.

IronOCR: C# Biblioteca OCR

IronOCR es una conocida biblioteca de OCR que utiliza técnicas de visión por ordenador para extraer texto de imágenes y documentos. Es fácil de usar y se integra con múltiples lenguajes de programación, incluidos C# y VB.NET. IronOCR está disponible tanto en versión local como en la nube y ofrece una serie de funcionalidades para procesar y extraer texto de imágenes.

Instalación de IronOCR

Para instalar IronOCR, utilice el siguiente comando en la consola del gestor de paquetes NuGet:

:ProductInstall

Sistema OCR con IronOCR

La siguiente imagen se utiliza para probar el Sistema OCR con visión por ordenador utilizando IronOCR.

OCR con visión por ordenador (ejemplo de tutorial), Figura 1: Muestra de imagen utilizada para la detección de OCR

Muestra de imagen utilizada para la detección OCR

BuscarRegiónDeTexto

En BuscarRegiónDeTexto se utiliza para identificar una única región de texto dentro de una imagen. El método toma varios parámetros opcionales, incluyendo Scale, DilationAmount, Binarize e Invert. Scale ajusta el tamaño de la imagen, DilationAmount aumenta el grosor del texto, Binarize convierte la imagen en blanco y negro, e Invert invierte los colores de la imagen.

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
	inputOCR.FindTextRegion()
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

Tras ejecutar el código, verás que extrae texto de la región de texto mediante un proceso de aprendizaje automático. El resultado aparece en la consola con una precisión de reconocimiento de texto de casi el 100%. La precisión de IronOCR es de casi el 100% para cualquier forma de texto, ya sea impreso o manuscrito.

OCR con visión por ordenador (ejemplo de tutorial), Figura 2: Consola de resultados del proceso de extracción de texto

Consola de resultados del proceso de extracción de texto

Método FindMultipleTextRegions

En BuscarRegionesDeTextoMúltiples es similar al método FindTextRegion, pero se utiliza cuando hay varias regiones de texto en una imagen. Devuelve una lista de objetos CropRectangle que definen la ubicación de cada región de texto. Este método es útil cuando se desea extraer texto de una imagen que contiene varias secciones de texto.

using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

El fragmento de código anterior es un ejemplo de cómo utilizar la biblioteca IronOCR para realizar un OCR en un archivo de imagen. En primer lugar, importa la biblioteca IronOCR y crea una nueva instancia del archivo IronTesseract clase. A continuación, inicializa un OcrInput con la ruta del archivo de imagen de entrada y aplica algunas técnicas de preprocesamiento para la corrección de imágenes utilizando el método FindMultipleTextRegions.

A continuación, llama al Leer del objeto IronTesseract, que realiza el OCR en la imagen preprocesada y devuelve un método OcrResult objeto. El texto extraído del objeto OcrResult se almacena en una variable de cadena y se imprime en la consola.

El resultado de IronOCR

La salida de IronOCR es muy precisa, incluso cuando se trata de imágenes complejas con múltiples fuentes, tamaños y estilos de texto.

La precisión del OCR es crucial a la hora de extraer datos de imágenes, ya que el texto extraído se utiliza a menudo para procesamientos posteriores, como el análisis de datos, la introducción manual de datos, el aprendizaje automático o el procesamiento del lenguaje natural. Si el texto extraído contiene errores, puede causar problemas posteriores. Además, IronOCR permite investigar los objetos resultantes para comprobar los niveles de confianza.

Casos prácticos de visión computerizada OCR

Reconocimiento óptico de caracteres (OCR) La tecnología ha revolucionado el tratamiento de los textos impresos y manuscritos. Las herramientas de OCR se han convertido en una parte indispensable del tratamiento de documentos y la extracción de datos. He aquí algunos casos de uso del software de reconocimiento óptico de caracteres:

Reconocimiento de matrículas OCR

Reconocimiento de matrículas desempeña un papel importante en la automatización de la gestión del tráfico, los sistemas de aparcamiento y las actividades policiales. Al implementar la visión por ordenador OCR en C#, los desarrolladores pueden crear aplicaciones que identifiquen con rapidez y precisión las matrículas a partir de imágenes o secuencias de vídeo en directo. Esta tecnología puede utilizarse para:

  • Controlar las infracciones de tráfico e identificar los vehículos implicados en actividades delictivas.
  • Automatizar los sistemas de aparcamiento, facilitando la gestión de entradas y salidas y agilizando el proceso de facturación.
  • Refuerce las medidas de seguridad mediante el seguimiento y la supervisión de los movimientos de vehículos en zonas restringidas.

Extraer texto de las facturas

La visión por ordenador OCR en C# puede utilizarse para desarrollar aplicaciones OCR que automaticen el extracción de texto de facturas y otros documentos financieros. Este proceso puede reducir drásticamente los errores de introducción manual de datos y agilizar las tareas contables. Las principales ventajas son:

  • Aumento de la productividad mediante la automatización del proceso de introducción de datos.
  • Mayor precisión, ya que el OCR reduce la probabilidad de errores humanos.
  • Perfecta integración con programas y sistemas de contabilidad para una gestión eficaz de los datos.

Generación de subtítulos OCR

Crear subtítulos para vídeos puede llevar mucho tiempo y requerir mucho trabajo. La visión por ordenador OCR en C# puede simplificar este proceso mediante la creación automática de detección y transcripción del texto en pantalla permitiendo a los desarrolladores:

  • Crea subtítulos precisos para películas, programas de televisión y vídeos en línea.
  • Mejorar la accesibilidad para las personas con discapacidad auditiva o que hablan idiomas diferentes.
  • Impulsar los esfuerzos de SEO proporcionando contenido indexable y con capacidad de búsqueda para la plataforma de vídeo.

Procesamiento OCR de PDF

Los PDF se utilizan mucho para compartir y almacenar documentos, pero extraer texto de ellos puede resultar complicado. La visión por ordenador OCR en C# puede ayudar a los desarrolladores a crear aplicaciones OCR que procesen sin esfuerzo archivos PDF y extraer su contenido facilitando:

Digitalización de texto impreso

El software OCR se utiliza ampliamente para digitalizar texto impreso a partir de imágenes de documentos. Las herramientas de OCR pueden extraer texto de documentos digitales escaneados, PDFs y imágenes en varios formatos. Esto es especialmente útil en la gestión de documentos, donde puedes buscar, almacenar y compartir fácilmente documentos basados en texto.

Extracción de texto manuscrito

La tecnología OCR ha avanzado hasta el punto de poder reconocer texto manuscrito con gran precisión. Esto es especialmente útil en ámbitos como la sanidad, donde los historiales médicos suelen contener notas manuscritas. Las herramientas de OCR pueden extraer texto manuscrito de historiales médicos, etiquetas de recetas y otros documentos escritos a mano.

Extracción de datos

La tecnología OCR se utiliza ampliamente para extraer datos de datos de entrada como facturas, recibos y formularios. Los modelos OCR pueden reconocer y extraer campos de datos clave como nombres, direcciones, fechas e importes. Esto elimina la necesidad de introducir datos manualmente y reduce los errores en el procesamiento de datos.

Búsqueda de imágenes

La tecnología OCR también se utiliza para la búsqueda de imágenes, que permite buscar imágenes a partir del texto que contienen. Esto es especialmente útil para grandes bibliotecas de imágenes, donde la búsqueda manual llevaría mucho tiempo.

Traducción

El software de OCR puede utilizarse para extraer texto de documentos en un idioma y traducirlo a otro. Esto es especialmente útil para las empresas internacionales, donde los documentos deben traducirse con rapidez y precisión.

Resumen

Reconocimiento óptico de caracteres (OCR) es una tecnología que permite a los ordenadores leer texto a partir de imágenes. El OCR junto con la visión por ordenador es importante porque permite a las máquinas comprender e interpretar el mundo visual, lo que es esencial para aplicaciones como los coches autoconducidos, la robótica y el procesamiento automatizado de documentos.

IronOCR es un potente motor de OCR que permite aplicar OCR con visión por ordenador para reconocer texto con precisión y realizar extracciones de texto de imágenes. Ofrece una serie de métodos para encontrar y extraer regiones de texto, como FindTextRegion, FindMultipleTextRegions y GetTextRegions. Cada método tiene su propio conjunto de parámetros que pueden utilizarse para afinar el proceso de OCR y proporcionan una alta precisión de OCR.

Con IronOCR, puede extraer el texto escaneado de imágenes de entrada de forma rápida y precisa utilizando concurrencia y configuración personalizada que puede ahorrarle tiempo y esfuerzo al tratar con grandes volúmenes de datos de imagen de entrada. Tanto si trabaja con documentos escaneados, fotografías o capturas de pantalla, IronOCR puede ayudarle a desentrañar el texto que contienen.

IronOCR ofrece una prueba gratuita a los usuarios que quieran probar el programa antes de tomar una decisión de compra. En licencia para IronOCR a partir de $599 e incluye soporte y actualizaciones durante un año. Con sus sólidas funciones y un precio razonable, IronOCR es una gran opción para cualquiera que busque una solución de OCR fiable con una alta precisión de OCR.

< ANTERIOR
Extracción de datos de recibos OCR (Tutorial paso a paso)
SIGUIENTE >
Cómo OCR Licencia de Conducir en C#

¿Listo para empezar? Versión: 2024.7 recién publicada

Descarga gratuita de NuGet Descargas totales: 2,012,139 Ver licencias >
123