Saltar al pie de página
HERRAMIENTAS OCR

Herramientas de OCR de Microsoft (Alternativas en C#)

El OCR (Reconocimiento Óptico de Caracteres) es una tecnología crucial para empresas de todos los tamaños. Permite escanear, almacenar y analizar datos de manera eficiente, lo que de otro modo consumiría mucho tiempo y sería complejo de manejar.

Las herramientas de OCR de Microsoft ofrecen opciones robustas para simplificar su proceso de transformación digital. Estas herramientas permiten un procesamiento de documentos más rápido y eficiente, liberando tiempo para que se concentre en la importante tarea de hacer crecer su negocio. En este artículo, exploraremos cómo utilizar las potentes herramientas de OCR de Microsoft para optimizar sus operaciones.

OneNote: Herramienta de Microsoft

Si necesita extraer texto de una imagen, Microsoft OneNote es una herramienta útil. OneNote es una aplicación versátil para tomar notas que proporciona una plataforma para capturar, almacenar y organizar información en diversas formas, como texto, imágenes, audio y video. También es una herramienta valiosa para copiar texto de imágenes o impresiones de archivos, ahorrándole tiempo y esfuerzo al eliminar la necesidad de escribir manualmente el texto.

Extraer texto usando OneNote

Para extraer texto de una imagen usando OneNote, siga estos pasos:

  1. Inicie la aplicación OneNote.
  2. Inserte el archivo de imagen usando la opción "Insertar" o simplemente arrastre y suelte el archivo de imagen en la ventana de OneNote.

    OneNote Insert ribbon

    Cinta de inserción de OneNote

  3. Haga clic derecho en la imagen y seleccione "Copiar texto de la imagen" del menú.

    Copiar texto de la imagen en el menú contextual

    Copiar texto de la imagen en el menú contextual

  4. Finalmente, pegue el texto copiado en cualquier ubicación deseada para acceder al texto extraído de la imagen escaneada.

    Texto procedente de texto copiado de una imagen

    Texto procedente de texto copiado de una imagen

Así es como puede usar OneNote para escanear cualquier imagen.

Microsoft Vision Studio

Microsoft Cognitive Services proporciona una función "Extraer texto de imágenes", utilizando IA para escanear imágenes y detectar texto con precisión. Este servicio es fácil de usar y solo requiere la carga de una imagen o archivo PDF. La información se transcribe con alta precisión, asegurando que el texto extraído represente fielmente el contenido de la imagen o archivo PDF.

Además, el texto extraído puede estar en varios idiomas, haciendo que el servicio sea accesible para usuarios de todo el mundo. Con "Extraer texto de imágenes" de Microsoft Cognitive Services, extraer datos valiosos de imágenes es simple y permite un análisis eficiente y una finalización efectiva de tareas.

Extraer texto con Microsoft Vision Studio

Para usar la función "Extraer texto de imágenes", puede visitar el sitio web de Vision Studio de Microsoft Azure. Sin embargo, este servicio requiere una suscripción a Azure. Una vez que haya adquirido una suscripción, tendrá acceso al texto extraído de documentos escaneados. La siguiente es una imagen de salida de muestra para referencia.

Imagen escaneada para su texto

Imagen escaneada para su texto

Software de OCR gratuito de Microsoft A9T9

El software de OCR gratuito A9T9 es una herramienta versátil que permite a los usuarios de Windows convertir fácilmente documentos en papel en texto digital. Su sencilla función de arrastrar y soltar permite el reconocimiento instantáneo de texto en múltiples idiomas, incluidos el inglés, alemán, chino, coreano e índico. Este software puede extraer datos de imágenes escaneadas o documentos PDF y convertirlos en un formato editable y buscable.

Este software admite varios formatos de salida, como Rich Text, TXT o CSV, y formatos de imagen como BMP, TIF o PDF. También tiene una función de enderezado automático de documentos. Este software es rápido y preciso en el reconocimiento de texto en imágenes de varios idiomas, incluso aquellas con fondos transparentes. La alta tasa de precisión de A9T9, su asequibilidad y su facilidad de instalación lo convierten en una opción destacada para usuarios de Windows que buscan una solución de software OCR gratuita.

Copiar texto usando A9T9

Puede descargar el software A9T9 desde la tienda de Microsoft. Después de la instalación, abra el software A9T9 y suba las imágenes o archivos PDF.

Imagen escaneada para su texto

Copiar texto usando A9T9

Una vez que la imagen o el documento están cargados, haga clic en el botón "Iniciar OCR". Esto extraerá el texto del documento o imagen escaneada y lo mostrará en el área de texto a la derecha.

The text is shown on the right hand side

El texto se muestra en el lado derecho.

Puede seleccionar el idioma de OCR y copiar el texto o guardarlo como un documento Word.

Lente de oficina

Office Lens es una herramienta sofisticada creada para capturar y organizar notas, pizarras, menús, letreros y otros tipos de información escrita o visual. Esta aplicación proporciona una alternativa superior a la toma de notas tradicional al eliminar la necesidad de notas escritas a mano y la posibilidad de perder información importante.

Office Lens permite a los usuarios capturar fácilmente bocetos, notas escritas a mano, dibujos y ecuaciones, y corregir imágenes para sombras y ángulos deformados para mejorar la legibilidad. También cuenta con OCR (Reconocimiento Óptico de Caracteres), permitiendo a los usuarios digitalizar y editar texto dentro de imágenes.

Desafortunadamente, Microsoft ha descontinuado la versión de Windows de Office Lens. Ahora solo está disponible en dispositivos móviles. Además, la Imagen de Documentos de Microsoft Office se eliminó de Microsoft Word 2010.

IronOCR: Biblioteca de OCR de C

IronOCR es una poderosa biblioteca de OCR en C# para desarrolladores .NET. Permite capacidades completas de OCR en documentos e imágenes escaneadas, haciendo fácil para los desarrolladores automatizar flujos de trabajo basados en documentos. Con su sencilla API y configuración mínima, es fácil integrar IronOCR en sistemas existentes.

La biblioteca ofrece una API simple, lo que facilita su integración en sistemas existentes con una configuración mínima. Admite una amplia gama de formatos de archivo de entrada, incluidos JPEG, TIFF, GIF, BMP, PDF, TIFFs de varias páginas y múltiples escaneos de documentos, y puede leer texto de imágenes con diferentes orientaciones.

Las características avanzadas de IronOCR incluyen eliminación de ruido, que ayuda a reducir la distorsión de la imagen y mejorar la precisión de los resultados de extracción de texto. Con soporte para más de 125 idiomas, incluidos el inglés, francés, alemán, español y japonés, la biblioteca es adecuada para casi cualquier aplicación que requiera resultados de OCR de alta calidad sin intervención manual.

Extraer texto usando IronOCR

Con la capacidad de extraer texto de archivos PDF con facilidad, es posible especificar números de página específicos o extraer texto de todas las páginas del documento. El proceso puede optimizarse y hacerse más eficiente con las herramientas adecuadas.

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using (var ocrInput = new OcrInput())
{
    // Add the entire PDF for OCR processing
    ocrInput.AddPdf("example.pdf");

    // Alternatively, OCR selected page numbers from a password-protected PDF
    ocrInput.AddPdfPages("example.pdf", new [] { 1, 2, 3 }, "password");

    // Perform OCR and get the result
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Output the extracted text
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using (var ocrInput = new OcrInput())
{
    // Add the entire PDF for OCR processing
    ocrInput.AddPdf("example.pdf");

    // Alternatively, OCR selected page numbers from a password-protected PDF
    ocrInput.AddPdfPages("example.pdf", new [] { 1, 2, 3 }, "password");

    // Perform OCR and get the result
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Output the extracted text
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()

Using ocrInput As New OcrInput()
	' Add the entire PDF for OCR processing
	ocrInput.AddPdf("example.pdf")

	' Alternatively, OCR selected page numbers from a password-protected PDF
	ocrInput.AddPdfPages("example.pdf", { 1, 2, 3 }, "password")

	' Perform OCR and get the result
	Dim ocrResult = ocrTesseract.Read(ocrInput)

	' Output the extracted text
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

Aquí está el resultado:

La salida dentro de la consola de depuración de Visual Studio

La salida dentro de la consola de depuración de Visual Studio

También puede leer fácilmente códigos de barras además de extraer texto de archivos PDF. La biblioteca proporciona una implementación de código simple para leer códigos de barras, convirtiéndola en una herramienta versátil para varios flujos de trabajo basados en documentos. Vea el siguiente código:

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;

// Read barcodes from an image file
using (var ocrInput = new OcrInput(@"images\imageWithBarcode.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Iterate through the detected barcodes and print their values
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;

// Read barcodes from an image file
using (var ocrInput = new OcrInput(@"images\imageWithBarcode.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Iterate through the detected barcodes and print their values
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True

' Read barcodes from an image file
Using ocrInput As New OcrInput("images\imageWithBarcode.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)

	' Iterate through the detected barcodes and print their values
	For Each barcode In ocrResult.Barcodes
		Console.WriteLine(barcode.Value)
	Next barcode
End Using
$vbLabelText   $csharpLabel
Entrada/Salida del código

Entrada/Salida del código

IronOCR es capaz de soportar imágenes de baja DPI y ruidosas al mejorarlas antes del procesamiento.

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

// Process a noisy image by deskewing and denoising it
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    ocrInput.Deskew(); // Corrects for skewness in the image
    ocrInput.DeNoise(); // Reduces visual noise for better recognition

    // Perform OCR and print the text
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

// Process a noisy image by deskewing and denoising it
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    ocrInput.Deskew(); // Corrects for skewness in the image
    ocrInput.DeNoise(); // Reduces visual noise for better recognition

    // Perform OCR and print the text
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()

' Process a noisy image by deskewing and denoising it
Using ocrInput As New OcrInput("images\image.png")
	ocrInput.Deskew() ' Corrects for skewness in the image
	ocrInput.DeNoise() ' Reduces visual noise for better recognition

	' Perform OCR and print the text
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

Conclusión

En conclusión, el Reconocimiento Óptico de Caracteres (OCR) es una herramienta vital que puede beneficiar enormemente a empresas de todos los tamaños, permitiéndoles escanear, almacenar y procesar información de manera eficiente que de otro modo sería compleja y consumiría mucho tiempo manejar manualmente. Microsoft ofrece varias herramientas de OCR, incluidas OneNote, Microsoft Vision Studio y el software libre A9T9 de OCR, que pueden optimizar los procesos y ahorrar tiempo.

IronOCR, una biblioteca de OCR bien equipada, es una opción destacada entre las herramientas de OCR disponibles. Es fácil de integrar con aplicaciones en C# y VB.NET, ofrece excelente precisión y reconocimiento de múltiples idiomas y formatos de imagen, y tiene un período de prueba gratuito, con costos de licencia a partir de $799. IronOCR es una inversión valiosa para las empresas que buscan mejorar su transformación digital. Cada una de estas herramientas de OCR ofrece características únicas y puede satisfacer diferentes necesidades, convirtiéndolas en activos valiosos para las empresas que buscan mejorar su transformación digital.

Kannaopat Udonpant
Ingeniero de Software
Antes de convertirse en Ingeniero de Software, Kannapat completó un doctorado en Recursos Ambientales de la Universidad de Hokkaido en Japón. Mientras perseguía su grado, Kannapat también se convirtió en miembro del Laboratorio de Robótica de Vehículos, que es parte del Departamento de Ingeniería ...
Leer más