Saltar al pie de página
HERRAMIENTAS OCR

OCR en Windows 10 (Herramientas gratuitas en línea)

El reconocimiento óptico de caracteres (OCR) es el proceso de convertir una imagen de texto en un formato legible por máquina. Cuando una imagen o documento se escanea en una computadora, se guarda como un archivo de imagen. Esto hace que sea imposible para los editores de texto editar, buscar o contar las palabras en el archivo de imagen. OCR permite a los sistemas extraer texto de una imagen, y luego el contenido se almacena como datos de texto editables.

La mayoría de los flujos de trabajo empresariales implican comunicar información mediante medios impresos. Escanear documentos e imágenes puede crear desafíos. La tecnología OCR resuelve este problema al convertir imágenes de texto en datos de texto que luego pueden ser analizados por otros software de negocios. Estos datos se pueden utilizar para realizar análisis, optimizar operaciones, automatizar procesos y mejorar la productividad.

Este artículo presentará algunos programas gratuitos de OCR que pueden ayudar a los usuarios a gestionar archivos eficientemente.

Microsoft OneNote: el mejor software gratuito de OCR

OneNote es una aplicación digital para tomar notas que ofrece un solo lugar para mantener todas tus notas, investigaciones, planes e información. OneNote admite Reconocimiento óptico de caracteres (OCR), una herramienta que te permite extraer texto de una imagen o de una impresión de archivo (documento PDF o archivo de Word) y pegarlo en tus notas, para que puedas hacer cambios en las palabras. Es una excelente manera de hacer cosas como copiar información de una tarjeta de presentación que has escaneado en OneNote. Después de extraer el texto, puedes pegarlo en otro lugar en OneNote u otro programa, como Outlook o Word. Puedes descargar la última versión desde la tienda de Microsoft, y a menudo ya está instalada en los sistemas Windows. Es una de las mejores opciones de software OCR gratuito para reconocimiento de texto.

OCR in Windows 10, Figure 1: OneNote OCR

Extraer texto de una sola imagen

  1. Haz clic derecho en la imagen y haz clic en Copiar texto de imagen.
  2. Haz clic donde quieras pegar el texto copiado y luego presiona Ctrl+V.

Extracción de texto de las imágenes de una impresión de un archivo de varias páginas

  1. Haz clic derecho en cualquiera de los archivos de imagen, y luego haz una de las siguientes acciones:
    • Haz clic en Copiar texto de esta página de la impresión para copiar texto solo de la imagen (página) actualmente seleccionada.
    • Haz clic en Copiar texto de todas las páginas de la impresión para copiar texto de todas las imágenes (páginas).
  2. Haz clic donde quieras pegar el texto copiado y luego presiona Ctrl+V.

Herramientas de OCR en línea

Acabamos de ver cómo podemos extraer texto de archivos de imagen usando la tecnología OCR con Microsoft OneNote en una máquina local. A continuación, echemos un vistazo a software OCR actualmente disponible en línea.

OCR en línea

OnlineOCR is a professional online OCR service with a clean and simple design. La apariencia de este sitio web puede parecer un poco anticuada ya que fue creado en 2009, pero esto también ayuda a mantener las operaciones de OCR bastante simples para los usuarios.

OnlineOCR te permite reconocer documentos PDF escaneados, fotografías e imágenes capturadas por cámaras digitales y convertirlos en archivos editables como Word, TXT y Excel. Se pueden reconocer 46 diferentes idiomas, incluyendo inglés, español, japonés, chino y coreano.

OCR in Windows 10, Figure 2: OnlineOCR

Hacer un trabajo de OCR con OnlineOCR lleva solo tres pasos fáciles.

Paso 1. Haz clic en el botón "Seleccionar archivo" para cargar un archivo PDF o un documento escaneado en formato JPG, BMP, GIF o TIFF. También puedes cargar múltiples archivos de una sola vez. Nota: el tamaño máximo del archivo que puedes cargar es de 15 MB.

Paso 2. Selecciona el idioma del archivo que cargas y elige un formato de salida de Word, Excel y TXT.

Paso 3. Haz clic en "Convertir" para comenzar a reconocer y convertir tus archivos.

Nuevo OCR

Another free online OCR tool is NewOCR, which can analyze the text in an image file or PDF document that you upload, and then convert it to a text document that can be edited easily on your computer. Cada usuario puede disfrutar de cargas ilimitadas sin ningún requisito de registro. Todos los archivos que subas serán eliminados del servidor, por lo que no hay necesidad de preocuparse por la seguridad de los archivos.

OCR in Windows 10, Figure 3: NewOCR

Primero, haz clic en "Elegir archivo" para agregar una imagen o documentos escaneados desde tu dispositivo, luego haz clic en "Vista previa".

A continuación, elige uno o varios idiomas de reconocimiento en el cuadro de lenguaje, luego gira la imagen si es necesario. Si tu archivo cargado contiene texto de varias columnas, marca la pestaña "Análisis de diseño de página" para dividir el texto en columnas. Finalmente, haz clic en el botón "OCR".

OCR in Windows 10, Figure 4: NewOCR

El texto reconocido se mostrará en el cuadro de texto a continuación. Puedes descargar el texto en formato TXT, Word o PDF.

OCR in Windows 10, Figure 5: NewOCR

Conversión

Convertio is a free online OCR service with a modern and attractive design. Los usuarios gratuitos no registrados pueden procesar un máximo de 10 páginas. Estos pueden ser archivos PDF o Word. También puedes usar un archivo PDF escaneado. Si necesitas reconocer más páginas, simplemente regístrate para obtener un mejor servicio.

Para realizar OCR en línea con Convertio, solo sigue estos tres pasos.

Paso 1. Haz clic en "Elegir archivos" para elegir y cargar archivos desde tu dispositivo local, Google Drive, Dropbox o páginas web. También puedes agregar archivos arrastrándolos a la página.

OCR in Windows 10, Figure 6: Convertio

Convertio

Step 2. Elige uno o dos idiomas utilizados en tu archivo cargado. Luego, establece el formato de salida a documento Word, libro de Excel, documento PDF, archivo de texto o lo que necesites. Puedes elegir reconocer todas las páginas o solo ciertas páginas ingresando un rango de páginas en el cuadro "Número de página".

OCR in Windows 10, Figure 7: Configuración de OCR de Convertio

Configuración de OCR de Convertio

Paso 3. Cuando se complete el reconocimiento y la conversión, aparecerá un enlace de descarga para el texto extraído en un documento convertido en la parte superior. Simplemente guárdalo en tu ubicación deseada.

OCR in Windows 10, Figure 8: Convertio Downloading Files

Descargar archivos de Convertio

Convertio ofrece más opciones como un servicio OCR en línea y, por lo tanto, es el mejor software OCR en línea gratuito.

IronOCR

IronOCR es una popular biblioteca de tecnología OCR para desarrolladores .NET que necesitan extraer texto de documentos escaneados o archivos PDF. Proporciona alta precisión, procesamiento rápido y un rendimiento sólido en tiempo real para imágenes, digitalización y reconocimiento. La biblioteca es un componente de software que simplifica la digitalización de documentos al automatizar el escaneo de documentos. También admite otros procesos, incluyendo la indexación de documentos y el procesamiento de imágenes.

IronOCR es único en su capacidad para detectar y extraer datos automáticamente de imágenes y documentos escaneados imperfectamente. La clase IronTesseract proporciona la construcción más avanzada de Tesseract conocida en cualquier lugar y en cualquier plataforma, con mayor velocidad y precisión.

Veamos un ejemplo de código para extraer texto de un archivo de imagen escaneada.

// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
' Import the necessary IronOCR namespace
Imports IronOcr

' Create an instance of the IronTesseract class
Private Ocr = New IronTesseract()

Using Input = New OcrInput()
	' Load the image file to perform OCR
	Input.AddImage("test-files/redacted-employmentapp.png")

	' Perform OCR to extract text from the image(s)
	Dim Result = Ocr.Read(Input)

	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Imagen de entrada para extraer texto

OCR in Windows 10, Figure 9: IronOCR, Datos redactados de empleados

Datos redactados de empleados

Salida de texto extraído

La salida es limpia y coincide con la imagen original con solo unas pocas líneas de código, traduciendo a una salida perfecta y sin problemas técnicos.

OCR in Windows 10, Figure 10: IronOCR, Salida de imagen

Salida de imagen

Licencias

IronOCR es completamente gratuito para propósitos de desarrollo. También tiene una estructura de precios distinta para licencias comerciales. El paquete Lite comienza en $799 sin tarifas ocultas. Los usuarios pueden probar IronOCR en producción antes de comprarlo con la prueba gratuita. Elija un paquete que coincida con el tamaño de su negocio optando por la licencia para un desarrollador, diez desarrolladores o desarrolladores ilimitados.

Iron Software está ofreciendo su suite completa de productos con un gran descuento. Obtén más detalles en esta página

Kannaopat Udonpant
Ingeniero de Software
Antes de convertirse en Ingeniero de Software, Kannapat completó un doctorado en Recursos Ambientales de la Universidad de Hokkaido en Japón. Mientras perseguía su grado, Kannapat también se convirtió en miembro del Laboratorio de Robótica de Vehículos, que es parte del Departamento de Ingeniería ...
Leer más