HERRAMIENTAS OCR

Power Automate OCR (Tutorial para Desarrolladores)

Publicado en 15 de diciembre, 2024
Compartir:

Introducción

El reconocimiento óptico de caracteres es la tecnología que escanea texto impreso o manuscrito desde imágenes, documentos escaneados y documentos PDF para transformarlo en texto legible por máquina. OCRpermite a las computadoras identificar varios formatos - libros, recibos, formularios y fotografías - que pueden ser digitalizados y automatizados para la extracción de datos en PDF. Analiza los caracteres en una imagen y los patrones, y luego los corresponde a texto. Esta tecnología de Reconocimiento Óptico de Caracteres se utiliza en las aplicaciones de digitalización de documentos, extracción y entrada de datos automatizada de PDF, procesamiento de facturas y hacer que los PDFs escaneados sean buscables.

Los OCR han mejorado drásticamente y pueden reconocer y leer diferentes idiomas, que hoy en día son complejos en la comprensión de diseño, como tablas y columnas. El software con capacidades avanzadas de OCR también utiliza técnicas de preprocesamiento para imágenes. Incluye la eliminación de ruido y el ajuste de contraste, mejorando la precisión del software OCR al leer imágenes de baja calidad. Tres de las herramientas OCR más populares son el motor Tesseract OCR, Power Automate e IronOCR, que ofrecen alta precisión y flexibilidad. Los OCR se han convertido en herramientas indispensables para empresas, investigadores y desarrolladores para externalizar la gestión de documentación y el reconocimiento de texto.

¿Qué es Microsoft Power Automate OCR?

Reconocimiento Óptico de Caracteres por Microsoft Power Automate: Utilizando esta función, las empresas pueden hacerse lo suficientemente competentes para automatizar la extracción de texto de imágenes, documentos escaneados y PDFs en formatos fácilmente editables y legibles por máquina. Al ser parte de la plataforma Microsoft Power, Power Automate de escritorio y en línea proporciona al usuario la capacidad de crear flujos sin necesidad de tener habilidades de codificación. Pueden automatizar la tediosa entrada de datos, procesar facturas y digitalizar documentos con la integración de OCR en los flujos de trabajo.

Imagen rota Añadir desde Pixabay, seleccionar de tus archivos o arrastrar y soltar una imagen aquí.

Esto les ahorra más tiempo y minimiza los errores. De hecho, es una herramienta de búsqueda poderosa que se puede utilizar para proporcionar soporte para muchos formatos e idiomas diferentes en la función OCR de Power Automate, construida con AI Builder, apoyando el uso del reconocimiento de texto en múltiples industrias. Se integra perfectamente con otros servicios de Microsoft, incluyendo Excel, SharePoint y OneDrive, para permitir que la automatización de extremo a extremo comience desde el escaneo del documento, hasta su almacenamiento o incluso compartirlo. En este sentido, ayuda a las organizaciones a aumentar la eficiencia, optimizar la gestión de documentos y mejorar la precisión operativa en sus actividades.

Beneficios de implementar OCR en Power Automate

Implementar OCR en Power Automate tiene las siguientes ventajas:

Ahorro de tiempo y mano de obra: La automatización de la extracción de texto de documentos ahorra mucho tiempo y esfuerzo que de otro modo se emplearían en la entrada manual de datos.

Rentable: Como es fácil de usar y accesible, hay poca o ninguna necesidad de soluciones de software personalizadas y costosas.

Integración: Microsoft Power Automate ofrece una integración perfecta con otros servicios de Microsoft 365 como SharePoint, OneDrive e incluso Excel.

Escalabilidad: Con su capacidad para manejar miles de documentos de una vez, su viabilidad lo hace adecuado para grandes empresas.

Reducción de errores: Dado que automatiza los procesos de entrada de datos, la posibilidad de que ocurran errores humanos se reduce al mínimo.

Cómo trabajar con OCR en Power Automate

Power Automate admite la funcionalidad OCR a través de varias conexiones diferentes, incluidas AI Builder y OneDrive. Aquí tienes una guía paso a paso sobre cómo obtener Power Automate en línea o cómo usar Power Automate Desktop para crear un flujo de trabajo habilitado para OCR:

1. Configurar Power Automate

Para comenzar, inicie sesión en su cuenta de Power Automate o regístrese si no tiene una. Power Automate es parte de Microsoft 365, lo que significa que ya tendrás acceso si estás usando Office 365 o Dynamics 365.

Imagen rota Añadir desde Pixabay, seleccionar de tus archivos o arrastrar y soltar una imagen aquí.

2: Crear un nuevo flujo

Abre la pestaña Crear y haz clic en Flujo instantáneo para crear un nuevo flujo que se pueda iniciar manualmente.

Imagen rota Añadir desde Pixabay, seleccionar de tus archivos o arrastrar y soltar una imagen aquí.

Nombra tu flujo. Por ejemplo, nómbrelo Antes de la aprobación y seleccione el siguiente desencadenador: Cuando se crea un archivo en una carpeta(SharePoint o OneDrive)o activar un flujo manualmente.

Imagen rota Añadir desde Pixabay, seleccionar de tus archivos o arrastrar y soltar una imagen aquí.

Se creó un nuevo flujo de automatización Power como el siguiente.

OCR de Power Automate(Tutorial para Desarrolladores): Figura 5 - Nuevo Flujo de Automatización

3: Cargar un archivo en OneDrive o SharePoint

Agrega una acción para subir tu documento(archivos PDF de imagen u otros)a OneDrive para Empresas o SharePoint. Esta acción activará el proceso OCR para extraer datos. Para esta demostración, estamos usando una biblioteca de documentos de SharePoint.

OCR de Power Automate(Tutorial para Desarrolladores): Figura 6 - Subir Archivo

4. Utilice la Acción OCR del AI Builder

Utilice AI Builder para desarrollar la acción de Extraer texto de imágenes. AI Builder es una característica profundamente integrada del Aprendizaje Automático en Power Automate y cuenta con modelos OCR pre-entrenados que los usuarios pueden utilizar fácilmente para identificar texto en imágenes o PDFs.

OCR de Power Automate(Tutorial para Desarrolladores): Figura 7 - AI Builder

Seleccione el archivo de imagen para extraer texto.

OCR de Power Automate (Tutorial para desarrolladores): Figura 8 - Seleccionar imagen

5. Procesamiento de Datos Extraídos

Una vez que los datos del idioma se extraen mediante OCR como texto, se pueden enviar para su posterior procesamiento. Por ejemplo:

Almacenar el texto extraído en un formato de Excel:** Utilizando la acción Agregar una fila, añade el texto extraído en un archivo de Excel.

Pasa el texto por correo electrónico: Usa la acción para enviar un correo electrónico a fin de reenviar el texto extraído a ciertos destinatarios.

Almacenar en la base de datos: Usar conectores para enviar datos a SQL Server, listas de SharePoint u otras bases de datos para almacenamiento.

¿Qué es IronOCR?

IronOCRes una potente biblioteca OCR para .NET que te permite extraer texto correctamente de imágenes, PDFs y escaneos mediante OCR. Brillará donde otras bibliotecas fallan en el reconocimiento de texto debido a la mala calidad de imagen o imágenes ruidosas, y admite más de 125 idiomas, lo que lo hace perfecto para casos de uso multilingües con diversidad. IronOCR encapsula una gran cantidad de funcionalidades avanzadas, como la detección automática de idioma y la eliminación de ruido en el preprocesamiento de imágenes, así como la corrección de sesgo, al igual que el mismo documento de diseño, incluyendo todos los estilos así como el detalle de la estructura e imagen a texto, así como PDF a texto con PDF buscable.

OCR de Power Automate(Tutorial para desarrolladores): Figura 9 - IronOCR

El producto se puede incorporar fácilmente a través de API sencillas de proyectos .NET, que permiten a los desarrolladores hacer uso de OCR en una aplicación que desarrollan. La biblioteca es útil para la digitalización de documentos, flujos de trabajo automatizados para la entrada de datos y tareas de extracción de texto con alta precisión y escalabilidad para aplicaciones a nivel empresarial. Su fortaleza radica en que la biblioteca es fácil de usar y ofrece potentes capacidades de OCR.

Características de IronOCR

  • Tiene una precisión excepcional en el texto que extrae, incluso de imágenes de baja resolución y documentos escaneados con ruido.
  • Admite más de 125 idiomas, con detección automática de idioma, lo que permite realizar OCR en entornos lingüísticos variados.
  • El preprocesamiento de una imagen requiere herramientas como la reducción de ruido, corrección de inclinación, mejora de contraste y nitidez, todas las cuales mejoran el rendimiento en imágenes imperfectas.
  • Crea PDFs con búsqueda de texto completo. Los documentos o imágenes escaneados se convierten en PDFs completamente buscables con el diseño original para facilitar las búsquedas y la organización.
  • Preservar el diseño y formato: Esta herramienta mantiene la estructura, las fuentes y el formato del documento original, ya que los diseños como las tablas y columnas son complejos y deben conservarse al realizar la digitalización.
  • Procesamiento por lotes: Esto permite el procesamiento por lotes de múltiples imágenes o documentos en una sola operación. La tecnología admite el manejo de documentos de gran volumen.
  • Integración fácil con .NET: Como soporta una API sencilla, se puede integrar fácilmente con aplicaciones .NET, constituyendo un mecanismo fácil de implementar para OCR sin un esfuerzo a gran escala por parte de los desarrolladores.

    Código de ejemplo para realizar OCR

using IronOcr;
class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine variable
        var Ocr = new IronTesseract();
        // Add multiple languages
        Ocr.Language = OcrLanguage.English;
        // Image file path
        var inputFile = @"path\to\your\image.png";
        // Read the image and perform OCR
        using (var input = new OcrInput(inputFile))
        {
            // Perform OCR
            var result = Ocr.Read(input);
            // Display the result
            Console.WriteLine("Text:");
            Console.WriteLine(result.Text);
        }
    }
}
using IronOcr;
class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine variable
        var Ocr = new IronTesseract();
        // Add multiple languages
        Ocr.Language = OcrLanguage.English;
        // Image file path
        var inputFile = @"path\to\your\image.png";
        // Read the image and perform OCR
        using (var input = new OcrInput(inputFile))
        {
            // Perform OCR
            var result = Ocr.Read(input);
            // Display the result
            Console.WriteLine("Text:");
            Console.WriteLine(result.Text);
        }
    }
}
Imports IronOcr
Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Initialize Iron Tesseract OCR engine variable
		Dim Ocr = New IronTesseract()
		' Add multiple languages
		Ocr.Language = OcrLanguage.English
		' Image file path
		Dim inputFile = "path\to\your\image.png"
		' Read the image and perform OCR
		Using input = New OcrInput(inputFile)
			' Perform OCR
			Dim result = Ocr.Read(input)
			' Display the result
			Console.WriteLine("Text:")
			Console.WriteLine(result.Text)
		End Using
	End Sub
End Class
VB   C#

Conclusión

Aunque tanto IronOCR como Power Automate OCR son altamente potentes en cuanto al reconocimiento de texto, IronOCR es considerablemente más robusto y versátil en su solución para cualquier desarrollador o empresa que necesite capacidades de OCR serias más allá de los casos simples admitidos por Power Automate OCR. En contraste, el motor OCR de Power Automate está diseñado para flujos de trabajo simples y probablemente requiera una suscripción adicional.

En cambio, IronOCR se destaca por ofrecer resultados de muy alta calidad, incluso cuando se trata de imágenes de entrada de baja calidad. Admite más de 125 idiomas, con una preservación potentemente formateada y estructurada. Su complejo procesamiento de documentos y las operaciones por lotes grandes son adecuadas para las capacidades avanzadas de preprocesamiento de imágenes. Sin embargo, a veces es altamente personalizable en aplicaciones .NET.

Si bien Power Automate OCR es suficiente para automatizaciones menores o para integraciones estrictamente construidas en Microsoft, IronOCR se lleva el oro por la cantidad de control que tiene un usuario, la máxima precisión, e incluso características como la creación de PDF con capacidad de búsqueda que admite múltiples formatos.

En organizaciones que pueden estar buscando una solución OCR personalizable y crítica en términos de energía sin restricciones de plataforma,IronOCR. Iron Software ofrece varios tipos de bibliotecas para que el desarrollador verifique laspágina de la suite de bibliotecas para saber más.

SIGUIENTE >
Easyocr vs Tesseract (Comparación de Características OCR)