Características de IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR es una biblioteca .NET que permite a los desarrolladores escanear y leer texto o códigos de barras a partir de imágenes.

Compatibilidad

Lenguajes .NET

  • C# (Tutorial Referencia de API
  • Escanea y lee textos o códigos de barras de imágenes (jpg, png, gif, tiff, bmp) en C#.
  • VB.NET
  • Escanee y lea textos o códigos de barras de imágenes (jpg, png, gif, tiff, bmp) en VB.NET.
  • F#

    • Escanea y lee texto o códigos de barras desde imágenes (jpg, png, gif, tiff, bmp) en F#.

Plataformas

  • .NET 5, 6, 7, y 8 (Tutorial)
  • IronOCR está disponible para .NET 5, 6, 7 y 8.
  • .NET Core 2 y 3 (Tutorial)

    • IronOCR está disponible para .NET Core 2 y 3.

    • La versión actual es compatible con .NET Core en sistemas operativos cliente Linux, Unix y macOS, así como con Mono.
  • Una futura versión será compatible con MAUI y Xamarin
  • .NET Standard 2+ (Referencia de API)
  • IronOCR es compatible con .NET Standard 2 y versiones posteriores.
  • .NET Framework 4.6.2+ (Ejemplo de código Referencia de API

    • Escanee y lea textos o códigos de barras de imágenes con .NET Framework 4.6.2 y superior.

Tipos de aplicaciones

Sistemas operativos

IDEs

  • Microsoft Visual Studio (Tutorial)
  • Jetbrains ReSharper y Rider

Certificación

  • Microsoft Authenticode

    • DigiCert Trusted G4 Firma de código RSA4096 SHA384 2021 CA1

Motor OCR

Motor OCR subyacente

  • Tesseract 5 (Tutorial Ejemplo de código
  • Tesseract es un motor de reconocimiento de texto (OCR) de código abierto, disponible bajo la licencia Apache 2.0. Una de las bibliotecas más precisas y rápidas está disponible para C#.NET. Actualmente, Tesseract 5 es la versión más estable.
  • Configuración Detallada (Ejemplo de Código)

    • El objeto IronTesseract.Configuration proporciona acceso a la API subyacente de Tesseract en C# / .NET para configurar la instalación para usuarios avanzados.

    • La configuración puede ayudar a mejorar la salida después de realizar el OCR.

    • Para mejorar la velocidad de OCR, por favor consulte este ejemplo de código para la Configuración Rápida de OCR.

Idiomas internacionales

Tutorial

Lectura de texto y códigos de barras

Documentos especializados

Este método utiliza el aprendizaje automático para mejorar el reconocimiento de textos.

Concurrencia

  • Monohilo y Multihilo (Cómo Hacer Ejemplo de código)
  • Soporte Asíncrono (Guía Referencia de API
  • Token de Aborto (Ejemplo de Código)
  • Permitir a los usuarios suspender el hilo actual durante un período especificado en milisegundos en el caso de la lectura de archivos de entrada de gran tamaño y hay un atasco mientras el programa o aplicación se está ejecutando.
  • Timeout (Ejemplo de código)

    • Proporciona un tiempo de espera opcional en milisegundos, tras el cual se cancelará la lectura OCR.

Visión por ordenador

Cómo Hacer Referencia de API

  • Utilice la visión por computadora para encontrar texto basado en nuestros modelos entrenados avanzados. IronOCR utiliza OpenCV para utilizar la visión por ordenador para detectar las áreas donde existe texto en una imagen. Esto es útil para imágenes que contienen mucho ruido, imágenes con texto en muchos lugares diferentes e imágenes en las que el texto está deformado. El uso de la visión por computadora en IronOCR determinará dónde existen las regiones de texto y luego utilizará Tesseract para intentar leer esas regiones.

Entrada OCR

Ejemplo de código

Leer desde muchos formatos

Filtros

  • Asistente de Filtro (Ejemplo de Código Referencia de API
  • En caso de no saber qué filtro debe aplicarse a la imagen, el Asistente de filtros proporciona la lista de filtros adecuados para OcrInput mediante un método de fuerza bruta que devuelve la combinación con la máxima confianza.
  • Filtros de imagen OCR (Cómo hacerlo Tutorial Ejemplo de Código

    • Sharpen (Referencia de API)

      * Da nitidez a los documentos OCR borrosos. Aplana los canales Alfa a blanco.
    • EnhanceResolution (Referencia de API)

      * Mejora la resolución de las imágenes de baja calidad.
    • Denoise (Referencia de API)

      * Elimina el ruido digital. Este filtro sólo debe utilizarse cuando se espera ruido. Aplana los canales Alfa a blanco.
    • Dilate (Referencia de API)

      * Morfología avanzada. La dilatación añade píxeles a los límites de los objetos de una imagen. Enfrente de Erode
    • Erode (Referencia de la API)
  • Morfología avanzada. La erosión elimina los píxeles de los límites del objeto. Opuesto a Dilatar
  • Corregir la Orientación de la Imagen (Cómo Hacerlo Tutorial Ejemplo de Código

    • Rotate (Tutorial Referencia de API

      * Gira las imágenes un número de grados en el sentido de las agujas del reloj. Para girar en sentido antihorario, utilice números negativos.
    • Deskew (Tutorial Referencia de API)

      * Gira una imagen para que quede al derecho y ortogonal. Esto resulta muy útil para el reconocimiento óptico de caracteres, ya que la tolerancia de Tesseract a los escaneados sesgados puede ser de tan sólo 5 grados.
    • Scale (Tutorial Referencia de la API)
  • Escala proporcionalmente las páginas OcrInput.
  • Corregir los colores de la imagen (Cómo hacerlo Tutorial Ejemplo de Código

    • Binarize (Tutorial Referencia de la API

      * Este filtro de imagen convierte cada píxel en blanco o negro sin término medio. Puede mejorar el rendimiento del OCR en casos de muy bajo contraste del texto con el fondo.
    • ToGrayscale (Referencia de API)

      * Este filtro de imagen convierte cada píxel en un tono de escala de grises. Es poco probable que mejore la precisión del OCR, pero puede mejorar la velocidad.
    • Invertir (Tutorial Referencia de API

      * Invierte todos los colores. Por ejemplo, el blanco se convierte en negro: el negro se convierte en blanco.
    • ReplaceColor (Referencia de API)

      * Sustituye un color de una imagen por otro con un umbral determinado.
    • SelectTextColor (Referencia de API)

      * Sustituye un color de una imagen por otro con un umbral determinado.

Aplicar una región de cultivo

Resultado OCR

Salida de datos simple

Cómo Hacerlo Ejemplo de Código

  • Cadenas de texto .NET
  • Datos de Código de Barras y QR
  • Imágenes

Salida de datos estructurados

Cómo Hacerlo Ejemplo de código

  • Páginas
  • Bloques
  • Párrafos
  • Líneas
  • Palabras
  • Caracteres

Exportar documentos

Resaltar texto en una página para depuración

  • Dibujar recuadros rojos alrededor del carácter/palabras/líneas/párrafo detectado como resaltado, y guardarlo como .png para depuración.

Situación y análisis