Características de IronOCR
IronOCR es una biblioteca .NET que permite a los desarrolladores escanear y leer texto o códigos de barras a partir de imágenes.
Compatibilidad
Lenguajes .NET
- C# (Tutorial Referencia de API
- Escanea y lee textos o códigos de barras de imágenes (jpg, png, gif, tiff, bmp) en C#.
- VB.NET
- Escanee y lea textos o códigos de barras de imágenes (jpg, png, gif, tiff, bmp) en VB.NET.
F#
- Escanea y lee texto o códigos de barras desde imágenes (jpg, png, gif, tiff, bmp) en F#.
Plataformas
- .NET 5, 6, 7, y 8 (Tutorial)
- IronOCR está disponible para .NET 5, 6, 7 y 8.
.NET Core 2 y 3 (Tutorial)
IronOCR está disponible para .NET Core 2 y 3.
- La versión actual es compatible con .NET Core en sistemas operativos cliente Linux, Unix y macOS, así como con Mono.
- Una futura versión será compatible con MAUI y Xamarin
- .NET Standard 2+ (Referencia de API)
- IronOCR es compatible con .NET Standard 2 y versiones posteriores.
.NET Framework 4.6.2+ (Ejemplo de código Referencia de API
- Escanee y lea textos o códigos de barras de imágenes con .NET Framework 4.6.2 y superior.
Tipos de aplicaciones
Consola, Web y Escritorio (Tutorial Referencia de API
- Cree aplicaciones para Web, Escritorio y Consola utilizando IronOCR.
Sistemas operativos
IDEs
- Microsoft Visual Studio (Tutorial)
- Jetbrains ReSharper y Rider
Certificación
Microsoft Authenticode
- DigiCert Trusted G4 Firma de código RSA4096 SHA384 2021 CA1
Motor OCR
Motor OCR subyacente
- Tesseract 5 (Tutorial Ejemplo de código
- Tesseract es un motor de reconocimiento de texto (OCR) de código abierto, disponible bajo la licencia Apache 2.0. Una de las bibliotecas más precisas y rápidas está disponible para C#.NET. Actualmente, Tesseract 5 es la versión más estable.
Configuración Detallada (Ejemplo de Código)
El objeto
IronTesseract.Configuration
proporciona acceso a la API subyacente de Tesseract en C# / .NET para configurar la instalación para usuarios avanzados.La configuración puede ayudar a mejorar la salida después de realizar el OCR.
- Para mejorar la velocidad de OCR, por favor consulte este ejemplo de código para la Configuración Rápida de OCR.
Idiomas internacionales
- 125 Idiomas (Lista Ejemplo de Código
- Alta, Media y Rápida Calidad para la mayoría de los idiomas (Ejemplo de Código)
- Idiomas personalizados (Ejemplo de código)
- Entrenamiento de Fuentes Personalizadas (Cómo Hacerlo)
Lectura de texto y códigos de barras
- Texto y Números (Ejemplo de Código)
- Múltiples idiomas a la vez (Cómo hacerlo Ejemplo de código
- Código de barras (más de 20 formatos) y código QR (Cómo Hacer Ejemplo de código
Documentos especializados
Este método utiliza el aprendizaje automático para mejorar el reconocimiento de textos.
- Documento Escaneado (Cómo Hacerlo Ejemplo de Código
- Optimizado para leer documentos escaneados o fotos de documentos en papel que contienen mucho texto.
- Tabla en Documento (Cómo hacer Ejemplo de Código
- Optimizado para documentos que contienen tablas con contornos claros.
- Placa de Matrícula (Cómo Hacerlo Ejemplo de Código)
- Optimizado para la lectura de matrículas a partir de fotos.
- Pasaporte (Guía Ejemplo de Código)
- Optimizado para leer y extraer información de pasaportes a partir de fotos escaneando el contenido de la zona de lectura mecánica (MRZ).
- Foto (Cómo hacerlo Ejemplo de Código
- Optimizado para leer imágenes que contienen texto difícil de leer.
Captura de pantalla (Cómo Hacerlo Ejemplo de Código
- Optimizado para leer capturas de pantalla que contienen texto difícil de leer.
Concurrencia
- Monohilo y Multihilo (Cómo Hacer Ejemplo de código)
- Soporte Asíncrono (Guía Referencia de API
- Token de Aborto (Ejemplo de Código)
- Permitir a los usuarios suspender el hilo actual durante un período especificado en milisegundos en el caso de la lectura de archivos de entrada de gran tamaño y hay un atasco mientras el programa o aplicación se está ejecutando.
Timeout (Ejemplo de código)
- Proporciona un tiempo de espera opcional en milisegundos, tras el cual se cancelará la lectura OCR.
Visión por ordenador
- Utilice la visión por computadora para encontrar texto basado en nuestros modelos entrenados avanzados. IronOCR utiliza OpenCV para utilizar la visión por ordenador para detectar las áreas donde existe texto en una imagen. Esto es útil para imágenes que contienen mucho ruido, imágenes con texto en muchos lugares diferentes e imágenes en las que el texto está deformado. El uso de la visión por computadora en IronOCR determinará dónde existen las regiones de texto y luego utilizará Tesseract para intentar leer esas regiones.
Entrada OCR
Leer desde muchos formatos
- Imágenes (jpg, png, gif, tiff, bmp) (Cómo hacer Ejemplo de Código
- Archivos tiff y gif de múltiples páginas y marcos (Cómo Hacerlo Ejemplo de Código
- Objetos System.Drawing(
Cómo-Hacerlo Ejemplo de Código - Streams (Cómo hacerlo Ejemplo de Código
- PDFs (Cómo Hacerlo Ejemplo de Código
Filtros
- Asistente de Filtro (Ejemplo de Código Referencia de API
- En caso de no saber qué filtro debe aplicarse a la imagen, el Asistente de filtros proporciona la lista de filtros adecuados para OcrInput mediante un método de fuerza bruta que devuelve la combinación con la máxima confianza.
Filtros de imagen OCR (Cómo hacerlo Tutorial Ejemplo de Código
Sharpen
(Referencia de API)* Da nitidez a los documentos OCR borrosos. Aplana los canales Alfa a blanco.
EnhanceResolution
(Referencia de API)* Mejora la resolución de las imágenes de baja calidad.
Denoise
(Referencia de API)* Elimina el ruido digital. Este filtro sólo debe utilizarse cuando se espera ruido. Aplana los canales Alfa a blanco.
Dilate
(Referencia de API)* Morfología avanzada. La dilatación añade píxeles a los límites de los objetos de una imagen. Enfrente de Erode
Erode
(Referencia de la API)
- Morfología avanzada. La erosión elimina los píxeles de los límites del objeto. Opuesto a Dilatar
Corregir la Orientación de la Imagen (Cómo Hacerlo Tutorial Ejemplo de Código
Rotate
(Tutorial Referencia de API* Gira las imágenes un número de grados en el sentido de las agujas del reloj. Para girar en sentido antihorario, utilice números negativos.
Deskew
(Tutorial Referencia de API)* Gira una imagen para que quede al derecho y ortogonal. Esto resulta muy útil para el reconocimiento óptico de caracteres, ya que la tolerancia de Tesseract a los escaneados sesgados puede ser de tan sólo 5 grados.
Scale
(Tutorial Referencia de la API)
- Escala proporcionalmente las páginas OcrInput.
Corregir los colores de la imagen (Cómo hacerlo Tutorial Ejemplo de Código
Binarize
(Tutorial Referencia de la API* Este filtro de imagen convierte cada píxel en blanco o negro sin término medio. Puede mejorar el rendimiento del OCR en casos de muy bajo contraste del texto con el fondo.
ToGrayscale
(Referencia de API)* Este filtro de imagen convierte cada píxel en un tono de escala de grises. Es poco probable que mejore la precisión del OCR, pero puede mejorar la velocidad.
Invertir
(Tutorial Referencia de API* Invierte todos los colores. Por ejemplo, el blanco se convierte en negro: el negro se convierte en blanco.
ReplaceColor
(Referencia de API)* Sustituye un color de una imagen por otro con un umbral determinado.
SelectTextColor
(Referencia de API)* Sustituye un color de una imagen por otro con un umbral determinado.
Aplicar una región de cultivo
CropRectangle (Ejemplo de Código Referencia de la API
- Dibujar un rectángulo con la coordenada inidentificada sobre un OcrInput.
Resultado OCR
Salida de datos simple
Cómo Hacerlo Ejemplo de Código
- Cadenas de texto .NET
- Datos de Código de Barras y QR
- Imágenes
Salida de datos estructurados
Cómo Hacerlo Ejemplo de código
- Páginas
- Bloques
- Párrafos
- Líneas
- Palabras
- Caracteres
Exportar documentos
PDFs buscables (Cómo hacer Tutorial
- PDF a PDF Buscable (Ejemplo de Código)
- TIFF a PDF Buscable (Ejemplo de Código)
- Exportar hOCR (Cómo hacerlo Tutorial
- Exportación de HTML
- Imagen de cualquier página o elemento de texto
- Código de barras o código QR como imagen
Resaltar texto en una página para depuración
- Dibujar recuadros rojos alrededor del carácter/palabras/líneas/párrafo detectado como resaltado, y guardarlo como .png para depuración.
Situación y análisis
- Seguimiento del Progreso de OCR (Ejemplo de Código)
- Confianza del Resultado (Cómo Hacerlo)