Características de IronOCR
IronOCR es una biblioteca .NET que permite a los desarrolladores escanear y leer texto o códigos de barras a partir de imágenes.
Compatibilidad
Lenguajes .NET
- C# (Tutorial | Referencia API)
- Escanear y leer textos o códigos de barras a partir de imágenes(jpg, png, gif, tiff, bmp) en C#.
- VB.NET
- Escanear y leer textos o códigos de barras a partir de imágenes(jpg, png, gif, tiff, bmp) en VB.NET.
- F#
- Escanear y leer texto o códigos de barras a partir de imágenes(jpg, png, gif, tiff, bmp) en F#.
Plataformas
- .NET 5, 6, 7 y 8 (Tutorial)
- IronOCR está disponible para .NET 5, 6, 7 y 8.
- .NET Core 2 y 3 (Tutorial)
- IronOCR está disponible para .NET Core 2 y 3.
- La versión actual es compatible con .NET Core en sistemas operativos cliente Linux, Unix y macOS, así como con Mono.
- Una futura versión será compatible con MAUI y Xamarin
- .NET Standard 2+ (Referencia API)
- IronOCR es compatible con .NET Standard 2 y versiones posteriores.
- .NET Framework 4.6.2+ (Ejemplo de código | Referencia API)
- Escanee y lea textos o códigos de barras de imágenes con .NET Framework 4.6.2 y superior.
Tipos de aplicaciones
- Consola, web y escritorio (Tutorial | Referencia API)
- Cree aplicaciones para Web, Escritorio y Consola utilizando IronOCR.
Sistemas operativos
IDEs
- Microsoft Visual Studio (Tutorial)
- Jetbrains ReSharper y Rider
Certificación
- Microsoft Authenticode
- DigiCert Trusted G4 Firma de código RSA4096 SHA384 2021 CA1
Motor OCR
Motor OCR subyacente
- Teseracto 5 (Tutorial | Ejemplo de código)
- Tesseract es un programa de reconocimiento de texto de código abierto(OCR) disponible bajo licencia Apache 2.0. Una de las bibliotecas más precisas y rápidas está disponible para C#.NET. Actualmente, Tesseract 5 es la versión más estable.
- Configuración detallada(Ejemplo de código)
- El objeto
IronTesseract.Configuration
proporciona acceso a la API subyacente de Tesseract en C# / .NET para configurar los ajustes para usuarios avanzados. - La configuración puede ayudar a mejorar la salida después de realizar el OCR.
- Para mejorar la velocidad de OCR, compruebe este ejemplo de código para la configuración rápida de OCR.
- El objeto
Idiomas internacionales
- 125 Lenguas (Lista | Ejemplo de código)
- Calidad alta, media y rápida para la mayoría de las lenguas (Ejemplo de código)
- Lenguas personalizadas (Ejemplo de código)
- Formación en fuentes personalizadas (Cómo Hacer)
Lectura de texto y códigos de barras
- Texto y números (Ejemplo de código)
- Varias lenguas a la vez (Cómo Hacer | Ejemplo de código)
- Código de barras (Más de 20 formatos) and QR Code (Cómo Hacer | Ejemplo de código)
Documentos especializados
- Recibos
- Comprobaciones (Cheques)
- Facturas
Concurrencia
- Monohilo y multihilo (Cómo Hacer | Ejemplo de código)
- Compatibilidad con Async (Cómo Hacer | Referencia API)
- Abortar Token (Ejemplo de código)
- Permitir a los usuarios suspender el hilo actual durante un período especificado en milisegundos en el caso de la lectura de archivos de entrada de gran tamaño y hay un atasco mientras el programa o aplicación se está ejecutando.
- Tiempo de espera (Ejemplo de código)
- Proporciona un tiempo de espera opcional en milisegundos, tras el cual se cancelará la lectura OCR.
Visión por ordenador
- Utilice Visión por Computador para encontrar texto basándose en nuestros avanzados modelos entrenados. IronOCR utiliza OpenCV para utilizar la visión por ordenador para detectar las áreas donde existe texto en una imagen. Esto es útil para imágenes que contienen mucho ruido, imágenes con texto en muchos lugares diferentes e imágenes en las que el texto está deformado. Use of computer vision in IronOCR will determine where text regions exists and then use Tesseract to attempt to read those regions.
Entrada OCR
Leer desde muchos formatos
- Imágenes (jpg, png, gif, tiff, bmp) (Cómo Hacer | Ejemplo de código)
- Archivos tiff y gif de varias páginas y marcos (Cómo Hacer | Ejemplo de código)
- Objetos System.Drawing (Cómo Hacer | Ejemplo de código)
- Corrientes (Cómo Hacer | Ejemplo de código)
- PDFs (Cómo Hacer | Ejemplo de código)
Filtros
- Asistente para filtros (Ejemplo de código | Referencia API)
- En caso de no saber qué filtro debe aplicarse a la imagen, el Asistente de filtros proporciona la lista de filtros adecuados para OcrInput mediante un método de fuerza bruta que devuelve la combinación con la máxima confianza.
Filtros de imagen OCR (Cómo Hacer | Tutorial | Ejemplo de código)
- Afilar (Referencia API)
- Da nitidez a los documentos OCR borrosos. Aplana los canales Alfa a blanco.
- Mejorar la resolución (Referencia API)
- Mejora la resolución de las imágenes de baja calidad.
Denoise
(Referencia API)- Elimina el ruido digital. Este filtro sólo debe utilizarse cuando se espera ruido. Aplana los canales Alfa a blanco.
Dilatar
(Referencia API)- Morfología avanzada. La dilatación añade píxeles a los límites de los objetos de una imagen. Enfrente de Erode
Erode
(Referencia API)- Morfología avanzada. La erosión elimina los píxeles de los límites del objeto. Opuesto a Dilatar
- Afilar (Referencia API)
- Corregir la orientación de la imagen (Cómo Hacer | Tutorial | Ejemplo de código)
Rotar
(Tutorial | Referencia API)- Gira las imágenes un número de grados en el sentido de las agujas del reloj. Para girar en sentido antihorario, utilice números negativos.
Deskew
(Tutorial | Referencia API)- Gira una imagen para que quede al derecho y ortogonal. Esto resulta muy útil para el reconocimiento óptico de caracteres, ya que la tolerancia de Tesseract a los escaneados sesgados puede ser de tan sólo 5 grados.
- Escala (Tutorial | Referencia API)
- Escala proporcionalmente las páginas OcrInput.
- Corregir los colores de la imagen (Cómo Hacer | Tutorial | Ejemplo de código)
Binarizar
(Tutorial | Referencia API)- Este filtro de imagen convierte cada píxel en blanco o negro sin término medio. Puede mejorar el rendimiento del OCR en casos de muy bajo contraste del texto con el fondo.
- a escala de grises (Referencia API)
- Este filtro de imagen convierte cada píxel en un tono de escala de grises. Es poco probable que mejore la precisión del OCR, pero puede mejorar la velocidad.
- "Invertir (Tutorial | Referencia API)
- Invierte todos los colores. Por ejemplo, el blanco se convierte en negro: el negro se convierte en blanco.
ReemplazarColor
(Referencia API)- Sustituye un color de una imagen por otro con un umbral determinado.
- SeleccionarColorDeTexto (Referencia API)
- Sustituye un color de una imagen por otro con un umbral determinado.
Aplicar una región de cultivo
- CropRectangle (Ejemplo de código | Referencia API)
- Dibujar un rectángulo con la coordenada inidentificada sobre un OcrInput.
Resultado OCR
Salida de datos simple
Cómo Hacer | Ejemplo de código
- Cadenas de texto .NET
- Código de barras y datos QR
- Imágenes
Salida de datos estructurados
Cómo Hacer | Ejemplo de código
- Páginas
- Bloquea
- Párrafos
- Líneas
- Palabras
- Personajes
Exportar documentos
- PDF con opción de búsqueda (Cómo Hacer | Tutorial)
- PDF a PDF con función de búsqueda(Ejemplo de código)
- TIFF a PDF con función de búsqueda(Ejemplo de código)
- Exportación hOCR (Cómo Hacer | Tutorial)
- Exportación HTML
- Imagen de cualquier página o elemento de texto
- Código de barras o QR como imagen
Resaltar texto en una página para depuración
- Dibujar recuadros rojos alrededor del carácter/palabras/líneas/párrafo detectado como resaltado, y guardarlo como .png para depuración.
Situación y análisis
- Seguimiento del progreso de la OCR (Ejemplo de código)
- Resultado Confianza (Cómo Hacer)