Pruebas en un entorno real
Pruebe en producción sin marcas de agua.
Funciona donde lo necesites.
Mucha gente por ahí se estará preguntando "¿Qué es una captura de pantalla OCR?". Otros se preguntarán cómo convertir una captura de pantalla de cualquier texto en un formato digital editable o en formato .txt, o .doc. Si usted es una de estas personas, no se preocupe más porque tenemos las soluciones perfectas para usted.
En este artículo, hablaremos de diferentes herramientas que le permitirán realizar OCR, Reconocimiento Óptico de Caracteres, en capturas de pantalla.
Existen muchas herramientas de OCR, pero hoy vamos a utilizar IronOCR para extraer texto de capturas de pantalla.
IronOCR es una biblioteca de software para los lenguajes de programación C# y VB.NET, diseñada para permitir a los desarrolladores añadir OCR (Reconocimiento óptico de caracteres) a sus aplicaciones. La biblioteca puede utilizarse para reconocer texto en imágenes y convertirlo en texto legible por máquina. La biblioteca se basa en el motor Tesseract OCR, considerado uno de los más precisos del mercado.
IronOCR puede utilizarse para leer texto de imágenes en muchos formatos de archivo diferentes, como PNG, JPG, TIFF y PDF. También ofrece una serie de funciones avanzadas para trabajar con el reconocimiento de texto, como la capacidad de reconocer varios idiomas, así como la capacidad de reconocer texto de imágenes que han sido giradas o sesgadas. Además, los desarrolladores pueden utilizar IronOCR para integrar rápidamente la funcionalidad de OCR en sus aplicaciones, ya que proporciona una API sencilla y fácil de usar que se puede llamar desde código C# o VB.NET. Con IronOCR puede elegir su idioma de OCR y realizar OCR en imágenes, archivos PDF digitales y archivos PDF escaneados.
IronOCR se considera una buena opción para los desarrolladores que deseen añadir funciones de OCR a sus aplicaciones. Es de código abierto, fácil de usar e integrar, rápido, preciso y está actualizado con las últimas tecnologías de OCR.
IronOCR ofrece una amplia gama de funciones para ayudar a los desarrolladores a integrar la funcionalidad OCR en sus aplicaciones. Algunas de las principales características de IronOCR son:
Soporte multilingüe: IronOCR puede reconocer texto en más de 60 idiomas, incluidos inglés, español, alemán, francés, italiano y chino.
**Detección automática de la orientación del texto: IronOCR puede detectar automáticamente la orientación del texto en una imagen, incluso si la imagen ha sido girada o sesgada.
Compatible con una amplia gama de formatos de imagen: IronOCR puede leer texto de imágenes en muchos formatos de archivo diferentes, incluyendo PNG, JPG, TIFFy PDF.
Ajustes de reconocimiento personalizables: Los desarrolladores pueden personalizar la configuración de reconocimiento para mejorar la precisión de reconocimiento para tipos específicos de imágenes o casos de uso.
Capacidad para reconocer texto de documentos escaneados y PDF con varias páginas.
Reconocimiento rápido y alta precisión: IronOCR utiliza el motor Tesseract OCR, que es uno de los motores OCR más precisos y utilizados del mercado.
API fácil de usar: IronOCR proporciona una API sencilla y fácil de usar que se puede llamar desde código C# o VB.NET, lo que facilita la integración de la funcionalidad OCR en cualquier aplicación.
En general, IronOCR es una potente herramienta que ofrece una amplia gama de funciones para ayudar a los desarrolladores a añadir funciones de OCR a sus aplicaciones.
Abra Visual Studio y vaya al menú Archivo. Seleccione "Nuevo Proyecto" y luego seleccione Aplicación de Consola.
Introduzca el nombre del proyecto y seleccione la ruta en el cuadro de texto correspondiente. A continuación, haga clic en el botón Crear. Seleccione el .NET Framework necesario, como en la captura de pantalla siguiente:
Creación de un nuevo proyecto en Visual Studio
El proyecto de Visual Studio generará ahora la estructura para la aplicación de consola. Una vez terminado, se abrirá el archivo program.cs
, en el que podrás escribir y ejecutar el código fuente.
El archivo program.cs, generado por el Asistente para nuevos proyectos de Visual Studio.
Ahora podemos añadir la librería IronOCR y probar el programa.
En Visual Studio, puede integrar fácilmente IronOCR con su proyecto C#.
IronOCR ofrece múltiples procesos para integrarse con un proyecto C# .NET. A continuación, hablaremos de uno de ellos: la instalación de IronOCR mediante el gestor de paquetes NuGet.
En Visual Studio, vaya a Herramientas > Administrador de paquetes NuGet > Consola del Administrador de paquetes.
**La interfaz de usuario del gestor de paquetes NuGet
Tras hacer clic, aparecerá una nueva consola en la parte inferior de la ventana de Visual Studio. Escriba el siguiente comando en la consola y pulse Intro.
Install-Package IronOcr
IronOCR se instalará en sólo unos segundos.
IronOCR es una potente librería OCR que puede utilizarse para reconocer texto de capturas de pantalla. Con IronOCR, puede realizar una captura de pantalla de texto y, a continuación, utilizar las funciones de OCR de la biblioteca para convertir el texto de la captura de pantalla en un formato digital editable. A continuación se muestra un ejemplo de cómo utilizar IronOCR para realizar un OCR en una captura de pantalla en C#. Para realizar el OCR de capturas de pantalla, sólo tienes que capturar una pantalla y ejecutar el siguiente código para extraer el texto a cualquier formato de salida que desees.
using IronOcr;
using System;
string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
using IronOcr;
using System;
string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
Imports IronOcr
Imports System
Private imageText As String = (New IronTesseract()).Read("ocr.png").Text
Console.WriteLine(imageText)
Captura de pantalla de ejemplo utilizada como entrada
- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 127+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework
IronOCR permite realizar OCR en zonas específicas de una imagen. Esto puede ser útil cuando la imagen contiene varias regiones de texto, y sólo desea reconocer el texto dentro de una región específica. A continuación se muestra un ejemplo de código.
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
ocrInput.AddImage("ocr.png", contentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
ocrInput.AddImage("ocr.png", contentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
Dim contentArea = New CropRectangle(x:= 0, y:= 0, width:= 350, height:= 150)
ocrInput.AddImage("ocr.png", contentArea)
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
Para realizar un OCR en una imagen y guardar el texto reconocido en un archivo .txt, puede utilizar el siguiente código.
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
var result = ocr.Read(input);
result.SaveAsTextFile("output.txt");
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
var result = ocr.Read(input);
result.SaveAsTextFile("output.txt");
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput("ocr.png")
Dim result = ocr.Read(input)
result.SaveAsTextFile("output.txt")
End Using
A continuación se muestra el contenido del archivo de salida:
Contenido del archivo output.txt generado
Leer el Extracción de texto de imágenes para obtener más información sobre cómo realizar OCR en imágenes.
IronOCR forma parte de un suite de cinco bibliotecas .NET diseñadas para trabajar con distintos tipos de documentos. Puede adquirir las cinco bibliotecas por el precio de sólo dos licencias.
9 productos API .NET para sus documentos de oficina