Cómo leer capturas de pantalla con IronOCR en C

This article was translated from English: Does it need improvement?
Translated
View the article in English

Las capturas de pantalla son una forma rápida y fácil de compartir información y capturar rápidamente información vital para enviar a colegas y compañeros. Sin embargo, extraer texto de las capturas de pantalla ha resultado ser difícil debido a las dimensiones y el ruido involucrados al tomarlas. Esto hace que las capturas de pantalla sean un medio menos efectivo en el lanzamiento de OCR.

Sin embargo, IronOCR resuelve ese problema al proporcionar métodos especializados como ReadScreenshot para combatir esto. ReadScreenshot está optimizado para leer capturas de pantalla y extraer información de ellas; también acepta formatos de archivo comunes.

Para usar esta función, también debes instalar el paquete IronOCR.Extension.AdvancedScan.

Inicio rápido: Leer texto de una captura de pantalla

Comience en segundos usando ReadScreenshot de IronOCR: simplemente cargue su captura de pantalla en un OcrInput, llame a ReadScreenShot, y acceda inmediatamente al texto extraído, puntaje de confianza y regiones de texto a través de OcrPhotoResult. Es la forma más rápida de convertir imágenes en texto utilizable con una configuración mínima.

Nuget IconEmpieza a crear PDF con NuGet ahora:

  1. Instalar IronOCR con el gestor de paquetes NuGet

    PM > Install-Package IronOcr

  2. Copie y ejecute este fragmento de código.

    OcrPhotoResult result = new IronTesseract().ReadScreenShot(new OcrInput().LoadImage("screenshot.png"));
  3. Despliegue para probar en su entorno real

    Empieza a utilizar IronOCR en tu proyecto hoy mismo con una prueba gratuita
    arrow pointer

En esta guía, demostraremos rápidamente cómo usar IronOCR para el reconocimiento de texto en capturas de pantalla, recorriendo ejemplos y las propiedades del objeto resultado.

Ejemplo de lectura de capturas de pantalla

Para leer una captura de pantalla en IronOCR, debemos aplicar los siguientes pasos. Utilizamos el método ReadScreenshot, que toma un OcrInput como parámetro para la entrada. Este método está más optimizado para capturas de pantalla que su contraparte estándar Read de la biblioteca.

@@--SOPORTE-i-ABIERTO--@@

  • El método actualmente funciona para idiomas que incluyen inglés, chino, japonés, coreano y alfabetos con base latina.
  • Usar escaneo avanzado en .NET Framework requiere que el proyecto se ejecute en arquitectura x64. @@--CIERRE DE SOPORTE--@@

Entrada

A continuación, nuestra entrada para el ejemplo de código; demostraremos la versatilidad de este método mezclando diferentes fuentes y tamaños de texto.

Input

Código

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
$vbLabelText   $csharpLabel

Resultado

Output

Como puede ver en la salida de la consola anterior, extrajo todas las instancias de texto de la captura de pantalla. Vamos a profundizar en las propiedades de OcrPhotoResult.

  • Text: El texto extraído de OCR Input.
  • Confidence: Una propiedad doble que indica la confianza estadística de precisión, con una escala de 0 a 1, donde 1 es el nivel más alto de confianza.
  • TextRegion: Una matriz de objetos TextRegion, que contienen propiedades que devuelven las áreas donde se encuentra el texto en la captura de pantalla. Por defecto, todo TextRegion es una clase derivada Rectangle de los modelos de IronOCR. Incluye las coordenadas x e y, así como la altura y el ancho del rectángulo.

Preguntas Frecuentes

¿Cómo puedo extraer texto de una captura de pantalla usando C#?

Puedes extraer texto de una captura de pantalla usando el método ReadScreenshot de IronOCR. Este método está optimizado para capturas de pantalla y admite múltiples idiomas. Comienza descargando la biblioteca IronOCR desde NuGet, luego importa tus capturas de pantalla y utiliza la función ReadScreenshot para recuperar texto.

¿Qué formatos de archivo son compatibles con el método ReadScreenshot?

El método ReadScreenshot en IronOCR está diseñado para aceptar formatos de archivo de imagen comunes, lo que lo hace versátil para la extracción de texto de varios tipos de archivos de captura de pantalla.

¿Por qué el método ReadScreenshot es preferible para capturas de pantalla?

El método ReadScreenshot está específicamente optimizado para las dimensiones y el ruido típicamente presentes en las capturas de pantalla, ofreciendo una extracción de texto más precisa en comparación con los métodos OCR estándar.

¿Qué idiomas admite IronOCR para la extracción de texto OCR?

IronOCR admite una variedad de idiomas para la extracción de texto OCR, incluyendo inglés, chino, japonés, coreano y alfabetos basados en el latín, lo que lo hace adecuado para aplicaciones diversas.

¿Cómo funciona la propiedad de confianza en IronOCR?

En IronOCR, la propiedad Confidence es un valor doble que varía de 0 a 1 e indica la probabilidad de la precisión del texto extraído. Un valor más cercano a 1 sugiere un nivel de confianza más alto.

¿Qué son los objetos TextRegion en IronOCR?

Los objetos TextRegion en IronOCR representan las áreas específicas en una captura de pantalla donde se detecta texto. Estos objetos incluyen coordenadas y dimensiones, ayudando a los usuarios a entender la disposición del texto extraído.

¿Necesito paquetes adicionales para mejorar las capacidades de IronOCR?

Sí, para utilizar funciones avanzadas de escaneo en IronOCR, debes instalar el paquete IronOcr.Extension.AdvancedScan desde NuGet, lo que mejora el rendimiento y las capacidades de la biblioteca.

¿Cómo puedo implementar IronOCR en mi proyecto de C# para leer capturas de pantalla?

Para implementar IronOCR en tu proyecto de C# para leer capturas de pantalla, primero descarga la biblioteca desde NuGet, importa tus imágenes de captura de pantalla y luego usa el método ReadScreenshot para extraer texto. Finalmente, procesa los datos extraídos usando la propiedad OcrPhotoResult.

Curtis Chau
Escritor Técnico

Curtis Chau tiene una licenciatura en Ciencias de la Computación (Carleton University) y se especializa en el desarrollo front-end con experiencia en Node.js, TypeScript, JavaScript y React. Apasionado por crear interfaces de usuario intuitivas y estéticamente agradables, disfruta trabajando con frameworks modernos y creando manuales bien ...

Leer más
¿Listo para empezar?
Nuget Descargas 5,167,857 | Version: 2025.11 recién lanzado