Características de IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR es una biblioteca .NET que permite a los desarrolladores escanear y leer texto o códigos de barras a partir de imágenes.

Compatibilidad

Lenguajes .NET

  • C# (Tutorial Referencia API)
    • Escanear y leer textos o códigos de barras a partir de imágenes (jpg, png, gif, tiff, bmp) en C#.
  • VB.NET
    • Escanear y leer textos o códigos de barras a partir de imágenes (jpg, png, gif, tiff, bmp) en VB.NET.
  • F#
    • Escanear y leer texto o códigos de barras a partir de imágenes (jpg, png, gif, tiff, bmp) en F#.

Plataformas

  • .NET 5, 6, 7 y 8 (Tutorial)
    • IronOCR está disponible para .NET 5, 6, 7 y 8.
  • .NET Core 2 y 3 (Tutorial)
    • IronOCR está disponible para .NET Core 2 y 3.
    • La versión actual es compatible con .NET Core en sistemas operativos cliente Linux, Unix y macOS, así como con Mono.
    • Una futura versión será compatible con MAUI y Xamarin
  • .NET Estándar 2+ (Referencia API)
    • IronOCR es compatible con .NET Standard 2 y versiones posteriores.
  • .NET Framework 4.6.2+ (Ejemplo de código Referencia API)
    • Escanee y lea textos o códigos de barras de imágenes con .NET Framework 4.6.2 y superior.

Tipos de aplicaciones

  • Consola, web y escritorio (Tutorial Referencia API)
    • Cree aplicaciones para Web, Escritorio y Consola utilizando IronOCR.

Sistemas operativos

IDEs

  • Microsoft Visual Studio (Tutorial)
  • Jetbrains ReSharper y Rider

Certificación

  • Microsoft Authenticode
    • DigiCert Trusted G4 Firma de código RSA4096 SHA384 2021 CA1

Motor OCR

Motor OCR subyacente

  • Teseracto 5 (Tutorial Ejemplo de código)
    • Tesseract es un programa de reconocimiento de texto de código abierto (OCR) disponible bajo licencia Apache 2.0. Una de las bibliotecas más precisas y rápidas está disponible para C#.NET. Actualmente, Tesseract 5 es la versión más estable.
  • Configuración detallada (Ejemplo de código)
    • El objeto IronTesseract.Configuration proporciona acceso a la API subyacente de Tesseract en C# / .NET para configurar los ajustes para usuarios avanzados.
    • La configuración puede ayudar a mejorar la salida después de realizar el OCR.
    • Para mejorar la velocidad de OCR, compruebe este ejemplo de código para la configuración rápida de OCR.

Idiomas internacionales

Tutorial

Lectura de texto y códigos de barras

Documentos especializados (Cómo Hacer)

Este método utiliza el aprendizaje automático para mejorar el reconocimiento de textos.

  • Documento
    • Optimizado para leer documentos escaneados o fotos de documentos en papel que contienen mucho texto.
  • Placa de matrícula
    • Optimizado para la lectura de matrículas a partir de fotos.
  • Pasaporte
    • Optimizado para leer y extraer información de pasaportes de fotos escaneando la zona legible por máquina (MRZ) contenidos.
  • Foto
    • Optimizado para leer imágenes que contienen texto difícil de leer.
  • Captura de pantalla
    • Optimizado para leer capturas de pantalla que contienen texto difícil de leer.

Concurrencia

  • Monohilo y multihilo (Cómo Hacer Ejemplo de código)
  • Compatibilidad con Async (Cómo Hacer Referencia API)
  • Abortar Token (Ejemplo de código)
    • Permitir a los usuarios suspender el hilo actual durante un período especificado en milisegundos en el caso de la lectura de archivos de entrada de gran tamaño y hay un atasco mientras el programa o aplicación se está ejecutando.
  • Tiempo de espera (Ejemplo de código)
    • Proporciona un tiempo de espera opcional en milisegundos, tras el cual se cancelará la lectura OCR.

Visión por ordenador

Cómo Hacer Referencia API

  • Utilice Visión por Computador para encontrar texto basándose en nuestros avanzados modelos entrenados. IronOCR utiliza OpenCV para utilizar la visión por ordenador para detectar las áreas donde existe texto en una imagen. Esto es útil para imágenes que contienen mucho ruido, imágenes con texto en muchos lugares diferentes e imágenes en las que el texto está deformado. Use of computer vision in IronOCR will determine where text regions exists and then use Tesseract to attempt to read those regions.

Entrada OCR

Ejemplo de código

Leer desde muchos formatos

Filtros

  • Asistente para filtros (Ejemplo de código Referencia API)
    • En caso de no saber qué filtro debe aplicarse a la imagen, el Asistente de filtros proporciona la lista de filtros adecuados para OcrInput mediante un método de fuerza bruta que devuelve la combinación con la máxima confianza.
  • Filtros de imagen OCR (Cómo Hacer Tutorial Ejemplo de código)
    • Afilar (Referencia API)
      • Da nitidez a los documentos OCR borrosos. Aplana los canales Alfa a blanco.
    • Mejorar la resolución (Referencia API)
      • Mejora la resolución de las imágenes de baja calidad.
    • Denoise (Referencia API)
      • Elimina el ruido digital. Este filtro sólo debe utilizarse cuando se espera ruido. Aplana los canales Alfa a blanco.
    • Dilatar (Referencia API)
      • Morfología avanzada. La dilatación añade píxeles a los límites de los objetos de una imagen. Enfrente de Erode
    • Erode (Referencia API)
      • Morfología avanzada. La erosión elimina los píxeles de los límites del objeto. Opuesto a Dilatar
  • Corregir la orientación de la imagen (Cómo Hacer Tutorial Ejemplo de código)
    • Rotar (Tutorial Referencia API)
      • Gira las imágenes un número de grados en el sentido de las agujas del reloj. Para girar en sentido antihorario, utilice números negativos.
    • Deskew (Tutorial Referencia API)
      • Gira una imagen para que quede al derecho y ortogonal. Esto resulta muy útil para el reconocimiento óptico de caracteres, ya que la tolerancia de Tesseract a los escaneados sesgados puede ser de tan sólo 5 grados.
    • Escala (Tutorial Referencia API)
      • Escala proporcionalmente las páginas OcrInput.
  • Corregir los colores de la imagen (Cómo Hacer Tutorial Ejemplo de código)
    • Binarizar (Tutorial Referencia API)
      • Este filtro de imagen convierte cada píxel en blanco o negro sin término medio. Puede mejorar el rendimiento del OCR en casos de muy bajo contraste del texto con el fondo.
    • a escala de grises (Referencia API)
      • Este filtro de imagen convierte cada píxel en un tono de escala de grises. Es poco probable que mejore la precisión del OCR, pero puede mejorar la velocidad.
    • "Invertir (Tutorial Referencia API)
      • Invierte todos los colores. Por ejemplo, el blanco se convierte en negro: el negro se convierte en blanco.
    • ReemplazarColor (Referencia API)
      • Sustituye un color de una imagen por otro con un umbral determinado.
    • SeleccionarColorDeTexto (Referencia API)
      • Sustituye un color de una imagen por otro con un umbral determinado.

Aplicar una región de cultivo

Resultado OCR

Salida de datos simple

Cómo Hacer Ejemplo de código

  • Cadenas de texto .NET
  • Código de barras y datos QR
  • Imágenes

Salida de datos estructurados

Cómo Hacer Ejemplo de código

  • Páginas
  • Bloquea
  • Párrafos
  • Líneas
  • Palabras
  • Personajes

Exportar documentos

Resaltar texto en una página para depuración

  • Dibujar recuadros rojos alrededor del carácter/palabras/líneas/párrafo detectado como resaltado, y guardarlo como .png para depuración.

Situación y análisis