Cómo Leer Capturas de Pantalla usando IronOCR
Las capturas de pantalla son una forma rápida y sencilla de compartir información y capturar rápidamente información vital para enviar a colegas y compañeros. Sin embargo, extraer texto de capturas de pantalla a menudo ha resultado difícil debido a las dimensiones y el ruido involucrados al tomarlas. Esto hace que las capturas de pantalla sean un medio menos efectivo en el lanzamiento de OCR.
Sin embargo, IronOCR resuelve ese problema al proporcionar métodos especializados como "ReadScreenShot" para combatirlo. ReadScreenshot está optimizado para leer capturas de pantalla y extraer información de ellas; también acepta formatos de archivo comunes.
En esta guía, demostraremos rápidamente cómo utilizar IronOCR para el reconocimiento de texto en capturas de pantalla, revisando ejemplos y las propiedades del objeto de resultado.
Cómo Leer Capturas de Pantalla usando IronOCR
- Descargar la biblioteca de C# para leer capturas de pantalla
- Importar las imágenes de captura de pantalla para el procesamiento
- Utiliza el
ReadScreenShot
método para extraer texto de la imagen - Recuperar los datos extraídos utilizando elOcrPhotoResultpropiedad para un procesamiento posterior
- Guarde o exporte el texto extraído según sea necesario
Comience a usar IronOCR en su proyecto hoy con una prueba gratuita.
Para usar esta función, también debe instalar el IronOcr.Extension.AdvancedScan paquete.
Ejemplo de leer capturas de pantalla
Para leer una captura de pantalla en IronOCR, tenemos que aplicar los siguientes pasos. Utilizamos el método ReadScreenShot
, que toma un OcrInput
como parámetro para la entrada. Este método está más optimizado para capturas de pantalla que el estándar Read
de la biblioteca.
Atención
- El método actualmente solo funciona para inglés, chino, japonés, coreano y alfabeto latino.
-
El uso de la exploración avanzada en .NET Framework requiere que el proyecto se ejecute en arquitectura x64.
Entrada
A continuación se muestra nuestra entrada para el ejemplo de código; demostraremos la versatilidad de este método mezclando diferentes fuentes y tamaños de texto.
Código
:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");
// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);
// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq
' Instantiate OCR engine
Private ocr = New IronTesseract()
Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")
' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)
' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
Salida
Como puedes ver en la salida de la consola arriba, extrajo todas las instancias de texto de la captura de pantalla. Vamos a profundizar en las propiedades de OcrPhotoResult
.
El texto extraído de la entrada OCR.
Confidence: Una propiedad "double" que indica la confianza en la precisión estadística de un promedio de cada carácter, siendo uno el nivel más alto y 0 el más bajo.
TextRegion: Un arreglo de "TextRegion" que contiene la propiedad que devuelve las áreas donde se encuentra texto en la captura de pantalla. De forma predeterminada, todo TextRegion
es una clase derivada de Rectangle
de los modelos de IronOCR. Devuelve las coordenadas x e y, así como la altura y el ancho del rectángulo.