Actualizado 16 de febrero, 2025
Compartir:

Cómo Leer Capturas de Pantalla usando IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

por Curtis Chau

Las capturas de pantalla son una forma rápida y sencilla de compartir información y capturar rápidamente información vital para enviar a colegas y compañeros. Sin embargo, extraer texto de capturas de pantalla a menudo ha resultado difícil debido a las dimensiones y el ruido involucrados al tomarlas. Esto hace que las capturas de pantalla sean un medio menos efectivo en el lanzamiento de OCR.

Sin embargo, IronOCR resuelve ese problema al proporcionar métodos especializados como "ReadScreenShot" para combatirlo. ReadScreenshot está optimizado para leer capturas de pantalla y extraer información de ellas; también acepta formatos de archivo comunes.

En esta guía, demostraremos rápidamente cómo utilizar IronOCR para el reconocimiento de texto en capturas de pantalla, revisando ejemplos y las propiedades del objeto de resultado.

Comience a usar IronOCR en su proyecto hoy con una prueba gratuita.

Primer Paso:
green arrow pointer

Para usar esta función, también debe instalar el IronOcr.Extension.AdvancedScan paquete.

Ejemplo de leer capturas de pantalla

Para leer una captura de pantalla en IronOCR, tenemos que aplicar los siguientes pasos. Utilizamos el método ReadScreenShot, que toma un OcrInput como parámetro para la entrada. Este método está más optimizado para capturas de pantalla que el estándar Read de la biblioteca.

Atención

  • El método actualmente solo funciona para inglés, chino, japonés, coreano y alfabeto latino.
  • El uso de la exploración avanzada en .NET Framework requiere que el proyecto se ejecute en arquitectura x64.

Entrada

A continuación se muestra nuestra entrada para el ejemplo de código; demostraremos la versatilidad de este método mezclando diferentes fuentes y tamaños de texto.

Entrada

Código

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
VB   C#

Salida

salida

Como puedes ver en la salida de la consola arriba, extrajo todas las instancias de texto de la captura de pantalla. Vamos a profundizar en las propiedades de OcrPhotoResult.

El texto extraído de la entrada OCR.

Confidence: Una propiedad "double" que indica la confianza en la precisión estadística de un promedio de cada carácter, siendo uno el nivel más alto y 0 el más bajo.

TextRegion: Un arreglo de "TextRegion" que contiene la propiedad que devuelve las áreas donde se encuentra texto en la captura de pantalla. De forma predeterminada, todo TextRegion es una clase derivada de Rectangle de los modelos de IronOCR. Devuelve las coordenadas x e y, así como la altura y el ancho del rectángulo.