Características de IronOCR

Translated

View the article in English

IronOCR es una biblioteca .NET que permite a los desarrolladores escanear y leer texto o códigos de barras a partir de imágenes.

Compatibilidad

Lenguajes .NET

C# (Tutorial Referencia de API
Escanea y lee textos o códigos de barras de imágenes (jpg, png, gif, tiff, bmp) en C#.
VB.NET
Escanee y lea textos o códigos de barras de imágenes (jpg, png, gif, tiff, bmp) en VB.NET.
F#
- Escanea y lee texto o códigos de barras desde imágenes (jpg, png, gif, tiff, bmp) en F#.

Plataformas

.NET 5, 6, 7, y 8 (Tutorial)
IronOCR está disponible para .NET 5, 6, 7 y 8.
.NET Core 2 y 3 (Tutorial)
- IronOCR está disponible para .NET Core 2 y 3.
- La versión actual es compatible con .NET Core en sistemas operativos cliente Linux, Unix y macOS, así como con Mono.
Una futura versión será compatible con MAUI y Xamarin
.NET Standard 2+ (Referencia de API)
IronOCR es compatible con .NET Standard 2 y versiones posteriores.
.NET Framework 4.6.2+ (Ejemplo de código Referencia de API
- Escanee y lea textos o códigos de barras de imágenes con .NET Framework 4.6.2 y superior.

Tipos de aplicaciones

Consola, Web y Escritorio (Tutorial Referencia de API
- Cree aplicaciones para Web, Escritorio y Consola utilizando IronOCR.

Sistemas operativos

Microsoft Windows (Tutorial)
Linux (Tutorial)
macOS
Docker (Tutorial
Azure (Tutorial
AWS

IDEs

Microsoft Visual Studio (Tutorial)
Jetbrains ReSharper y Rider

Certificación

Microsoft Authenticode
- DigiCert Trusted G4 Firma de código RSA4096 SHA384 2021 CA1

Motor OCR

Motor OCR subyacente

Tesseract 5 (Tutorial Ejemplo de código
Tesseract es un motor de reconocimiento de texto (OCR) de código abierto, disponible bajo la licencia Apache 2.0. Una de las bibliotecas más precisas y rápidas está disponible para C#.NET. Actualmente, Tesseract 5 es la versión más estable.
Configuración Detallada (Ejemplo de Código)
- El objeto IronTesseract.Configuration proporciona acceso a la API subyacente de Tesseract en C# / .NET para configurar la instalación para usuarios avanzados.
- La configuración puede ayudar a mejorar la salida después de realizar el OCR.
- Para mejorar la velocidad de OCR, por favor consulte este ejemplo de código para la Configuración Rápida de OCR.

Idiomas internacionales

Tutorial

125 Idiomas (Lista Ejemplo de Código
Alta, Media y Rápida Calidad para la mayoría de los idiomas (Ejemplo de Código)
Idiomas personalizados (Ejemplo de código)
Entrenamiento de Fuentes Personalizadas (Cómo Hacerlo)

Lectura de texto y códigos de barras

Texto y Números (Ejemplo de Código)
Múltiples idiomas a la vez (Cómo hacerlo Ejemplo de código
Código de barras (más de 20 formatos) y código QR (Cómo Hacer Ejemplo de código

Documentos especializados

Este método utiliza el aprendizaje automático para mejorar el reconocimiento de textos.

Documento Escaneado (Cómo Hacerlo Ejemplo de Código
Optimizado para leer documentos escaneados o fotos de documentos en papel que contienen mucho texto.
Tabla en Documento (Cómo hacer Ejemplo de Código
Optimizado para documentos que contienen tablas con contornos claros.
Placa de Matrícula (Cómo Hacerlo Ejemplo de Código)
Optimizado para la lectura de matrículas a partir de fotos.
Pasaporte (Guía Ejemplo de Código)
Optimizado para leer y extraer información de pasaportes a partir de fotos escaneando el contenido de la zona de lectura mecánica (MRZ).
Foto (Cómo hacerlo Ejemplo de Código
Optimizado para leer imágenes que contienen texto difícil de leer.
Captura de pantalla (Cómo Hacerlo Ejemplo de Código
- Optimizado para leer capturas de pantalla que contienen texto difícil de leer.

Concurrencia

Monohilo y Multihilo (Cómo Hacer Ejemplo de código)
Soporte Asíncrono (Guía Referencia de API
Token de Aborto (Ejemplo de Código)
Permitir a los usuarios suspender el hilo actual durante un período especificado en milisegundos en el caso de la lectura de archivos de entrada de gran tamaño y hay un atasco mientras el programa o aplicación se está ejecutando.
Timeout (Ejemplo de código)
- Proporciona un tiempo de espera opcional en milisegundos, tras el cual se cancelará la lectura OCR.

Visión por ordenador

Cómo Hacer Referencia de API

Utilice la visión por computadora para encontrar texto basado en nuestros modelos entrenados avanzados. IronOCR utiliza OpenCV para utilizar la visión por ordenador para detectar las áreas donde existe texto en una imagen. Esto es útil para imágenes que contienen mucho ruido, imágenes con texto en muchos lugares diferentes e imágenes en las que el texto está deformado. El uso de la visión por computadora en IronOCR determinará dónde existen las regiones de texto y luego utilizará Tesseract para intentar leer esas regiones.

Entrada OCR

Ejemplo de código

Leer desde muchos formatos

Imágenes (jpg, png, gif, tiff, bmp) (Cómo hacer Ejemplo de Código
Archivos tiff y gif de múltiples páginas y marcos (Cómo Hacerlo Ejemplo de Código
Objetos System.Drawing(Cómo-Hacerlo Ejemplo de Código
Streams (Cómo hacerlo Ejemplo de Código
PDFs (Cómo Hacerlo Ejemplo de Código

Filtros

Asistente de Filtro (Ejemplo de Código Referencia de API
En caso de no saber qué filtro debe aplicarse a la imagen, el Asistente de filtros proporciona la lista de filtros adecuados para OcrInput mediante un método de fuerza bruta que devuelve la combinación con la máxima confianza.

Filtros de imagen OCR (Cómo hacerlo Tutorial Ejemplo de Código

Sharpen (Referencia de API)

* Da nitidez a los documentos OCR borrosos. Aplana los canales Alfa a blanco.

EnhanceResolution (Referencia de API)

* Mejora la resolución de las imágenes de baja calidad.

Denoise (Referencia de API)

* Elimina el ruido digital. Este filtro sólo debe utilizarse cuando se espera ruido. Aplana los canales Alfa a blanco.

Dilate (Referencia de API)

* Morfología avanzada. La dilatación añade píxeles a los límites de los objetos de una imagen. Enfrente de Erode

Erode (Referencia de la API)

Morfología avanzada. La erosión elimina los píxeles de los límites del objeto. Opuesto a Dilatar

Corregir la Orientación de la Imagen (Cómo Hacerlo Tutorial Ejemplo de Código

Rotate (Tutorial Referencia de API

* Gira las imágenes un número de grados en el sentido de las agujas del reloj. Para girar en sentido antihorario, utilice números negativos.

Deskew (Tutorial Referencia de API)

* Gira una imagen para que quede al derecho y ortogonal. Esto resulta muy útil para el reconocimiento óptico de caracteres, ya que la tolerancia de Tesseract a los escaneados sesgados puede ser de tan sólo 5 grados.

Scale (Tutorial Referencia de la API)

Escala proporcionalmente las páginas OcrInput.

Corregir los colores de la imagen (Cómo hacerlo Tutorial Ejemplo de Código

Binarize (Tutorial Referencia de la API

* Este filtro de imagen convierte cada píxel en blanco o negro sin término medio. Puede mejorar el rendimiento del OCR en casos de muy bajo contraste del texto con el fondo.

ToGrayscale (Referencia de API)

* Este filtro de imagen convierte cada píxel en un tono de escala de grises. Es poco probable que mejore la precisión del OCR, pero puede mejorar la velocidad.

Invertir (Tutorial Referencia de API

* Invierte todos los colores. Por ejemplo, el blanco se convierte en negro: el negro se convierte en blanco.

ReplaceColor (Referencia de API)

* Sustituye un color de una imagen por otro con un umbral determinado.

SelectTextColor (Referencia de API)

* Sustituye un color de una imagen por otro con un umbral determinado.

Aplicar una región de cultivo

CropRectangle (Ejemplo de Código Referencia de la API
- Dibujar un rectángulo con la coordenada inidentificada sobre un OcrInput.

Resultado OCR

Salida de datos simple

Cómo Hacerlo Ejemplo de Código

Cadenas de texto .NET
Datos de Código de Barras y QR
Imágenes

Salida de datos estructurados

Cómo Hacerlo Ejemplo de código

Páginas
Bloques
Párrafos
Líneas
Palabras
Caracteres

Exportar documentos

PDFs buscables (Cómo hacer Tutorial
- PDF a PDF Buscable (Ejemplo de Código)
TIFF a PDF Buscable (Ejemplo de Código)
Exportar hOCR (Cómo hacerlo Tutorial
Exportación de HTML
Imagen de cualquier página o elemento de texto
Código de barras o código QR como imagen

Resaltar texto en una página para depuración

Dibujar recuadros rojos alrededor del carácter/palabras/líneas/párrafo detectado como resaltado, y guardarlo como .png para depuración.

Situación y análisis

Seguimiento del Progreso de OCR (Ejemplo de Código)
Confianza del Resultado (Cómo Hacerlo)

Descripción general de funciones de IronOCR

Compatibilidad

Motor OCR

Entrada OCR

Resultado OCR

Soporte multiplataforma

Características de IronOCR

Compatibilidad

Lenguajes .NET

Plataformas

Tipos de aplicaciones

Sistemas operativos

IDEs

Certificación

Motor OCR

Motor OCR subyacente

Idiomas internacionales

Lectura de texto y códigos de barras

Documentos especializados

Concurrencia

Visión por ordenador

Entrada OCR

Leer desde muchos formatos

Filtros

Aplicar una región de cultivo

Resultado OCR

Salida de datos simple

Salida de datos estructurados

Exportar documentos

Resaltar texto en una página para depuración

Situación y análisis

¿Listo para empezar? Versión: 2025.5 acaba de salir

IronOCR forma parte de IRONSUITE

Descripción general de funciones de IronOCR

Compatibilidad

Motor OCR

Entrada OCR

Resultado OCR

Soporte multiplataforma

Características de IronOCR

Compatibilidad

Lenguajes .NET

Plataformas

Tipos de aplicaciones

Sistemas operativos

IDEs

Certificación

Motor OCR

Motor OCR subyacente

Idiomas internacionales

Lectura de texto y códigos de barras

Documentos especializados

Concurrencia

Visión por ordenador

Entrada OCR

Leer desde muchos formatos

Filtros

Aplicar una región de cultivo

Resultado OCR

Salida de datos simple

Salida de datos estructurados

Exportar documentos

Resaltar texto en una página para depuración

Situación y análisis

¿Listo para empezar? Versión: 2025.5 acaba de salir

Siguiente paso: Comienza la prueba gratuita de 30 días

Siguiente paso: Comienza la prueba gratuita de 30 días

Más de 2 millones de ingenieros de todo el mundo confían en nosotros

IronOCR forma parte de IRONSUITE