Características de IronOCR
IronOCR es una biblioteca .NET que permite a los desarrolladores escanear y leer texto o códigos de barras a partir de imágenes.
Compatibilidad
Lenguajes .NET
- C# (Tutorial Referencia API)
- Escanear y leer textos o códigos de barras a partir de imágenes(jpg, png, gif, tiff, bmp) en C#.
- VB.NET
- Escanear y leer textos o códigos de barras a partir de imágenes(jpg, png, gif, tiff, bmp) en VB.NET.
F#
- Escanear y leer texto o códigos de barras a partir de imágenes(jpg, png, gif, tiff, bmp) en F#.
Plataformas
- .NET 5, 6, 7 y 8 (Tutorial)
- IronOCR está disponible para .NET 5, 6, 7 y 8.
.NET Core 2 y 3 (Tutorial)
IronOCR está disponible para .NET Core 2 y 3.
- La versión actual es compatible con .NET Core en sistemas operativos cliente Linux, Unix y macOS, así como con Mono.
- Una futura versión será compatible con MAUI y Xamarin
- .NET Estándar 2+ (Referencia API)
- IronOCR es compatible con .NET Standard 2 y versiones posteriores.
.NET Framework 4.6.2+ (Ejemplo de código Referencia API)
- Escanee y lea textos o códigos de barras de imágenes con .NET Framework 4.6.2 y superior.
Tipos de aplicaciones
Consola, web y escritorio (Tutorial Referencia API)
- Cree aplicaciones para Web, Escritorio y Consola utilizando IronOCR.
Sistemas operativos
IDEs
- Microsoft Visual Studio (Tutorial)
- Jetbrains ReSharper y Rider
Certificación
Microsoft Authenticode
- DigiCert Trusted G4 Firma de código RSA4096 SHA384 2021 CA1
Motor OCR
Motor OCR subyacente
- Teseracto 5 (Tutorial Ejemplo de código)
- Tesseract es un programa de reconocimiento de texto de código abierto(OCR) disponible bajo licencia Apache 2.0. Una de las bibliotecas más precisas y rápidas está disponible para C#.NET. Actualmente, Tesseract 5 es la versión más estable.
Configuración detallada(Ejemplo de código)
El objeto
IronTesseract.Configuration
proporciona acceso a la API subyacente de Tesseract en C# / .NET para configurar los ajustes para usuarios avanzados.La configuración puede ayudar a mejorar la salida después de realizar el OCR.
- Para mejorar la velocidad de OCR, compruebeeste ejemplo de código para la configuración rápida de OCR.
Idiomas internacionales
- 25 Lenguas (Lista Ejemplo de código)
- Calidad alta, media y rápida para la mayoría de las lenguas (Ejemplo de código)
- Lenguas personalizadas (Ejemplo de código)
- Formación en fuentes personalizadas (Cómo Hacer)
Lectura de texto y códigos de barras
- Texto y números (Ejemplo de código)
- Varias lenguas a la vez (Cómo Hacer Ejemplo de código)
- Código de barras (Más de 20 formatos) and QR Code (Cómo Hacer Ejemplo de código)
Documentos especializados (Cómo Hacer)
Este método utiliza el aprendizaje automático para mejorar el reconocimiento de textos.
- Documento
- Optimizado para leer documentos escaneados o fotos de documentos en papel que contienen mucho texto.
- Placa de matrícula
- Optimizado para la lectura de matrículas a partir de fotos.
- Pasaporte
- Optimizado para leer y extraer información de pasaportes de fotos escaneando la zona legible por máquina(MRZ) contenidos.
- Foto
- Optimizado para leer imágenes que contienen texto difícil de leer.
Captura de pantalla
- Optimizado para leer capturas de pantalla que contienen texto difícil de leer.
Concurrencia
- Monohilo y multihilo (Cómo Hacer Ejemplo de código)
- Compatibilidad con Async (Cómo Hacer Referencia API)
- Abortar Token (Ejemplo de código)
- Permitir a los usuarios suspender el hilo actual durante un período especificado en milisegundos en el caso de la lectura de archivos de entrada de gran tamaño y hay un atasco mientras el programa o aplicación se está ejecutando.
Tiempo de espera (Ejemplo de código)
- Proporciona un tiempo de espera opcional en milisegundos, tras el cual se cancelará la lectura OCR.
Visión por ordenador
- Utilice Visión por Computador para encontrar texto basándose en nuestros avanzados modelos entrenados. IronOCR utiliza OpenCV para utilizar la visión por ordenador para detectar las áreas donde existe texto en una imagen. Esto es útil para imágenes que contienen mucho ruido, imágenes con texto en muchos lugares diferentes e imágenes en las que el texto está deformado. Use of computer vision in IronOCR will determine where text regions exists and then use Tesseract to attempt to read those regions.
Entrada OCR
Leer desde muchos formatos
- Imágenes (jpg, png, gif, tiff, bmp) (Cómo Hacer Ejemplo de código)
- Archivos tiff y gif de varias páginas y marcos (Cómo Hacer Ejemplo de código)
- Objetos System.Drawing (Cómo Hacer Ejemplo de código)
- Corrientes (Cómo Hacer Ejemplo de código)
- PDFs (Cómo Hacer Ejemplo de código)
Filtros
- Asistente para filtros (Ejemplo de código Referencia API)
- En caso de no saber qué filtro debe aplicarse a la imagen, el Asistente de filtros proporciona la lista de filtros adecuados para OcrInput mediante un método de fuerza bruta que devuelve la combinación con la máxima confianza.
Filtros de imagen OCR (Cómo Hacer Tutorial Ejemplo de código)
Afilar (Referencia API)
* Da nitidez a los documentos OCR borrosos. Aplana los canales Alfa a blanco.
Mejorar la resolución (Referencia API)
* Mejora la resolución de las imágenes de baja calidad.
Denoise
(Referencia API)* Elimina el ruido digital. Este filtro sólo debe utilizarse cuando se espera ruido. Aplana los canales Alfa a blanco.
Dilatar
(Referencia API)* Morfología avanzada. La dilatación añade píxeles a los límites de los objetos de una imagen. Enfrente de Erode
Erode
(Referencia API)
- Morfología avanzada. La erosión elimina los píxeles de los límites del objeto. Opuesto a Dilatar
Corregir la orientación de la imagen (Cómo Hacer Tutorial Ejemplo de código)
Rotar
(Tutorial Referencia API)* Gira las imágenes un número de grados en el sentido de las agujas del reloj. Para girar en sentido antihorario, utilice números negativos.
Deskew
(Tutorial Referencia API)* Gira una imagen para que quede al derecho y ortogonal. Esto resulta muy útil para el reconocimiento óptico de caracteres, ya que la tolerancia de Tesseract a los escaneados sesgados puede ser de tan sólo 5 grados.
- Escala (Tutorial Referencia API)
- Escala proporcionalmente las páginas OcrInput.
Corregir los colores de la imagen (Cómo Hacer Tutorial Ejemplo de código)
Binarizar
(Tutorial Referencia API)* Este filtro de imagen convierte cada píxel en blanco o negro sin término medio. Puede mejorar el rendimiento del OCR en casos de muy bajo contraste del texto con el fondo.
a escala de grises (Referencia API)
* Este filtro de imagen convierte cada píxel en un tono de escala de grises. Es poco probable que mejore la precisión del OCR, pero puede mejorar la velocidad.
"Invertir (Tutorial Referencia API)
* Invierte todos los colores. Por ejemplo, el blanco se convierte en negro: el negro se convierte en blanco.
ReemplazarColor
(Referencia API)* Sustituye un color de una imagen por otro con un umbral determinado.
SeleccionarColorDeTexto (Referencia API)
* Sustituye un color de una imagen por otro con un umbral determinado.
Aplicar una región de cultivo
CropRectangle (Ejemplo de código Referencia API)
- Dibujar un rectángulo con la coordenada inidentificada sobre un OcrInput.
Resultado OCR
Salida de datos simple
- Cadenas de texto .NET
- Código de barras y datos QR
- Imágenes
Salida de datos estructurados
- Páginas
- Bloquea
- Párrafos
- Líneas
- Palabras
- Personajes
Exportar documentos
PDF con opción de búsqueda (Cómo Hacer Tutorial)
- PDF a PDF con función de búsqueda(Ejemplo de código)
- TIFF a PDF con función de búsqueda(Ejemplo de código)
- Exportación hOCR (Cómo Hacer Tutorial)
- Exportación HTML
- Imagen de cualquier página o elemento de texto
- Código de barras o QR como imagen
Resaltar texto en una página para depuración
- Dibujar recuadros rojos alrededor del carácter/palabras/líneas/párrafo detectado como resaltado, y guardarlo como .png para depuración.
Situación y análisis
- Seguimiento del progreso de la OCR (Ejemplo de código)
- Resultado Confianza (Cómo Hacer)