Saltar al pie de página
USANDO IRONOCR

OCR C# GitHub: Reconocimiento de texto con IronOCR

IronOCR simplifica la integración del OCR en proyectos de C# en GitHub al proporcionar una solución de un solo archivo DLL con una precisión del 99,8 %, preprocesamiento integrado y compatibilidad con más de 125 idiomas, lo que elimina la compleja configuración que requieren las implementaciones de Tesseract sin procesar.

Empiece con IronOCR ahora.
green arrow pointer

Si eres un desarrollador de C# que está explorando opciones de OCR en GitHub, es probable que necesites algo más que código. Buscas una biblioteca que funcione desde el primer momento, que incluya ejemplos ejecutables y que cuente con una comunidad activa detrás. Una integración fiable y un control de versiones sólido son tan importantes como la precisión. Esta guía te explica cómo integrar IronOCR en tus proyectos de GitHub para que puedas gestionar el reconocimiento de texto en imágenes y archivos PDF con total confianza.

Tanto si su objetivo es extraer texto sin formato, extraer palabras y líneas estructuradas o generar archivos PDF con capacidad de búsqueda para su archivo, IronOCR le ofrece la solución. La biblioteca admite todo, desde la lectura de BarCodes hasta el OCR multilingüe en más de 125 idiomas.

¿Cómo empezar a utilizar IronOCR y GitHub?

IronOCR es una solución OCR for .NET que se integra de forma natural en los flujos de trabajo de desarrollo basados en GitHub. A diferencia de las implementaciones crudas de Tesseract que requieren una configuración compleja, IronOCR proporciona una API refinada que te pone en funcionamiento en minutos.

Para quienes se inician en el reconocimiento óptico de caracteres, la documentación de IronOCR abarca todo, desde la extracción básica de texto hasta el procesamiento avanzado de imágenes. La biblioteca incluye compatibilidad integrada con filtros de imagen y técnicas de optimización de OCR que, de otro modo, requerirían un ajuste manual considerable.

Una de las razones por las que los desarrolladores se decantan por IronOCR para proyectos de GitHub es su previsibilidad. Cuando un colaborador clona tu repositorio y ejecuta tu proyecto, el motor OCR debe comportarse de forma idéntica en su máquina. La arquitectura autónoma de IronOCR lo hace posible sin necesidad de fijar binarios nativos específicos de la plataforma en tu repositorio.

¿Qué método de instalación debes utilizar?

Empieza instalando IronOCR a través del Administrador de paquetes NuGet:

Install-Package IronOcr

Ventana del Administrador de paquetes NuGet en Visual Studio que muestra los resultados de la búsqueda del paquete IronOCR con varios paquetes de idiomas disponibles para su instalación

NuGet Instalar con NuGet

PM >  Install-Package IronOcr

Echa un vistazo a IronOCR en NuGet para una instalación rápida. Con más de 10 millones de descargas, está transformando el desarrollo de PDF con C#. También puede descargar el DLL o el instalador de Windows.

Para escenarios de instalación avanzados, consulte la guía de paquetes NuGet. Si vas a realizar la implementación en plataformas específicas, consulta las guías para Windows, Linux, macOS o contenedores Docker.

¿Dónde se puede encontrar código de ejemplo?

IronOCR mantiene repositorios oficiales en GitHub con ejemplos y tutoriales. El repositorio de ejemplos de IronOCR ofrece implementaciones reales, mientras que el repositorio del tutorial "Image to Text" muestra casos de uso prácticos que puedes clonar y modificar.

Estos repositorios muestran funciones de OCR con lectura de BarCode, compatibilidad multilingüe y procesamiento de PDF. Dado que IronOCR publica paquetes con frecuencia en NuGet, siempre tendrás acceso a las últimas versiones estables.

Diagrama de flujo que muestra el proceso de OCR: Repositorio de OCR de GitHub → Proyecto IronOCR → Procesamiento de OCR → Salida de texto extraído

¿Cómo se crea el primer proyecto de OCR en GitHub?

Crear una aplicación de OCR adecuada para compartir en GitHub requiere una estructura coherente que los colaboradores puedan explorar de inmediato. En Visual Studio (o tu IDE preferido), crea una nueva aplicación de consola que siga las convenciones establecidas para el desarrollo de OCR.

¿Qué estructura de proyecto debes utilizar?

MyOcrProject/
├── src/
│   └── OcrProcessor.cs
├── images/
│   └── sample-invoice.jpg
├── .gitignore
├── README.md
└── MyOcrProject.csproj

Esta estructura admite varios formatos de entrada, incluidos JPG, PNG, TIFF y BMP. Para procesar archivos TIFF o GIF de varias páginas, IronOCR los gestiona automáticamente.

La carpeta images/ mantiene los archivos de muestra organizados y facilita a los colaboradores añadir imágenes de prueba sin saturar el directorio raíz. Mantener la carpeta src/ separada de los archivos de configuración hace que el proyecto sea más fácil de leer de un vistazo. Añade un README.md que explique qué hace el proyecto, qué variable de clave de licencia hay que configurar y cómo ejecutar el ejemplo.

¿Cómo se implementa el código de procesamiento OCR?

El siguiente ejemplo muestra un procesador OCR completo que ilustra las características clave de IronOCR, incluyendo el preprocesamiento de imágenes, la extracción de texto y la detección de BarCodes:

using IronOcr;

var ocr = new IronTesseract();
ocr.Configuration.ReadBarCodes = true;
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;
ocr.Language = OcrLanguage.English;

using var input = new OcrInput();
input.LoadImage("images/sample-invoice.jpg");
input.Deskew();
input.DeNoise();
input.EnhanceResolution(225);

var result = ocr.Read(input);

Console.WriteLine($"Confidence: {result.Confidence}%");
Console.WriteLine($"Text Found:\n{result.Text}");

foreach (var barcode in result.Barcodes)
{
    Console.WriteLine($"Barcode: {barcode.Value} ({barcode.Format})");
}

result.SaveAsSearchablePdf("output.pdf");
using IronOcr;

var ocr = new IronTesseract();
ocr.Configuration.ReadBarCodes = true;
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;
ocr.Language = OcrLanguage.English;

using var input = new OcrInput();
input.LoadImage("images/sample-invoice.jpg");
input.Deskew();
input.DeNoise();
input.EnhanceResolution(225);

var result = ocr.Read(input);

Console.WriteLine($"Confidence: {result.Confidence}%");
Console.WriteLine($"Text Found:\n{result.Text}");

foreach (var barcode in result.Barcodes)
{
    Console.WriteLine($"Barcode: {barcode.Value} ({barcode.Format})");
}

result.SaveAsSearchablePdf("output.pdf");
$vbLabelText   $csharpLabel

Este ejemplo muestra varias capacidades de IronOCR. El constructor configura el motor OCR con la lectura de BarCodes habilitada y la segmentación automática de páginas. El proceso de preprocesamiento muestra la corrección de la inclinación (corrección de la rotación), la eliminación de ruido (eliminación de artefactos) y la mejora de la resolución.

Tras el procesamiento, el motor extrae el texto en inglés con puntuaciones de confianza, identifica los BarCodes y genera un PDF con capacidad de búsqueda. El código está escrito utilizando sentencias de primer nivel for .NET 10, lo que permite que el ejemplo sea breve y legible.

Para escenarios avanzados, puede utilizar el procesamiento asíncrono para obtener un mayor rendimiento o implementar el seguimiento del progreso para operaciones de larga duración. La clase OcrResult proporciona una salida detallada que incluye posiciones de texto, coordenadas de palabras y estructura de párrafos, lo que te ofrece mucho más que una simple cadena de texto.

Los desarrolladores también pueden configurar IronOCR para leer otros idiomas, como el chino, el español o el francés, lo que lo convierte en una opción ideal para proyectos multilingües en GitHub. Para obtener información sobre cómo instalar paquetes de idiomas adicionales, consulte la guía de 125 idiomas internacionales.

Pantalla dividida que muestra una demostración de OCR: el lado izquierdo muestra texto Lorem Ipsum sesgado sobre fondo blanco; el lado derecho muestra la consola de depuración de Visual Studio con el texto extraído y una puntuación de confianza del 87,34 %

¿Qué debes incluir en tu archivo .gitignore?

En tu archivo .gitignore, incluye entradas que impidan que se confirmen artefactos de tiempo de ejecución, resultados de pruebas y configuraciones secretas:

# IronOCR runtime files
runtimes/
# Test images and outputs
*.pdf
test-images/
output/
# License keys
appsettings.*.json

Es especialmente importante mantener la carpeta runtimes/ fuera del control de código fuente, ya que IronOCR descarga binarios específicos de la plataforma en el momento de la compilación. Incluirlos en el repositorio lo sobrecargaría y crearía conflictos de plataforma. Más información sobre la gestión de claves de licencia para una implementación adecuada.

¿Por qué deberías elegir IronOCR para tus proyectos de GitHub?

IronOCR ofrece ventajas distintivas para desarrolladores que mantienen proyectos OCR en GitHub. La biblioteca logra un 99.8% de precisión desde el primer momento sin requerir entrenamiento manual o archivos de configuración complejos que llenen los repositorios. Con soporte para más de 125 idiomas, tu proyecto de GitHub puede dar servicio a usuarios internacionales sin necesidad de modificaciones.

Las características de compatibilidad garantizan la implementación multiplataforma en Windows, Linux, macOS y plataformas en la nube como Azure y AWS. Esta compatibilidad multiplataforma es fundamental para proyectos de código abierto y de equipo en los que los colaboradores pueden trabajar en diferentes sistemas operativos.

¿Qué diferencia a IronOCR de otras soluciones de OCR?

IronOCR es lo suficientemente flexible como para reconocer palabras sueltas, líneas y párrafos completos, lo que le permite controlar con precisión el nivel de detalle que extrae de cada escaneo. La biblioteca destaca en tipos de documentos especializados, como matrículas, pasaportes, texto manuscrito, capturas de pantalla y documentos escaneados.

La licencia comercial proporciona claridad legal para repositorios públicos. Se permite expresamente incluir IronOCR en aplicaciones comerciales. Los filtros de preprocesamiento de imágenes integrados incluyen opciones avanzadas como la corrección del color, la mejora de la calidad y un asistente de filtros que encuentra automáticamente la configuración óptima para imágenes difíciles.

¿Por qué es importante la arquitectura de DLL única?

La arquitectura de un solo DLL de IronOCR significa que los colaboradores pueden clonar tu repositorio y comenzar a desarrollar de inmediato, sin tener que lidiar con dependencias nativas o configuraciones específicas de la plataforma que plagan otras soluciones OCR. Esta simplicidad es la razón por la que los desarrolladores eligen IronOCR en lugar del Tesseract sin procesar.

Si se compara la experiencia de configuración, una implementación básica de Tesseract suele requerir la instalación por separado de binarios nativos, la configuración de variables PATH y la gestión manual de los archivos de idioma tessdata. IronOCR se encarga de todo eso internamente, lo que significa que el archivo README de tu proyecto puede centrarse en la lógica de tu aplicación en lugar de en las instrucciones de configuración del Entorno.

La biblioteca incluye Tesseract 5 con numerosas mejoras de rendimiento y compatibilidad con multihilo, lo que le permite procesar varios documentos en paralelo sin necesidad de escribir código de subprocesos personalizado.

¿Cuáles son las mejores prácticas de control de versiones para proyectos de OCR?

La gestión de proyectos de OCR en GitHub plantea algunos retos a los que no se enfrentan los proyectos de software habituales. Las imágenes de prueba suelen ser archivos binarios de gran tamaño, las claves de licencia nunca deben aparecer en las confirmaciones y las configuraciones de preprocesamiento pueden variar significativamente entre entornos.

Abordar estos aspectos desde el principio significa menos sorpresas a la hora de trabajar con un equipo o aceptar pull requests de colaboradores. Las siguientes prácticas garantizan que su proyecto de OCR sea limpio y fácil de mantener a lo largo del tiempo.

¿Cómo se gestionan los archivos de gran tamaño en Git?

Utiliza Git LFS para imágenes de prueba de gran tamaño a fin de mantener el tamaño de tu repositorio manejable:

git lfs track "*.jpg" "*.png" "*.tiff"
git add .gitattributes
git commit -m "Track large image files with Git LFS"
git lfs track "*.jpg" "*.png" "*.tiff"
git add .gitattributes
git commit -m "Track large image files with Git LFS"
SHELL

Esto es especialmente importante cuando se trabaja con imágenes de alta resolución o archivos TIFF de varias páginas. En el caso de escaneos de baja calidad, el preprocesamiento de IronOCR puede mejorar significativamente los resultados sin necesidad de editar manualmente las imágenes de prueba antes de procesarlas.

Al almacenar documentos de prueba en su repositorio, tenga en cuenta si contienen información confidencial. Es preferible generar imágenes de prueba sintéticas mediante programación que incluir facturas o documentos de identificación reales, incluso en repositorios privados.

¿Cómo se deben gestionar las claves de licencia y la documentación?

Almacene las claves de licencia de IronOCR utilizando variables de entorno o secretos de usuario de .NET. Nunca las envíes directamente a ninguna rama, ni siquiera a las privadas. Siga la guía de claves de licencia para una implementación correcta. También puede configurar las licencias en web.config para aplicaciones ASP.NET.

Indique los formatos de imagen admitidos y los niveles de precisión esperados en su archivo README. Incluye imágenes de muestra en una carpeta test-data/ para que los colaboradores puedan verificar la funcionalidad del OCR inmediatamente después de clonar. Añade una breve sección que explique cómo configurar la clave de licencia mediante una variable de entorno para que los nuevos colaboradores no se vean bloqueados en su primera ejecución.

Para el desarrollo multiplataforma, consulte la guía de configuración de IronOCR para Linux o las instrucciones de instalación para macOS. Los desarrolladores de aplicaciones móviles deben consultar las guías para Android e iOS disponibles en la documentación de IronOCR.

¿Cuáles son los consejos habituales para la resolución de problemas?

¿Por qué no funciona el OCR en Windows?

Entre los problemas de configuración más comunes se encuentra la falta de los componentes redistribuibles de Visual C++ en Windows. IronOCR requiere la versión de 2019. Para obtener orientación detallada, consulte la guía de resolución de problemas de Visual C++ Redistributable. Para implementaciones en Linux, asegúrate de que libgdiplus esté instalado.

Si el reconocimiento de texto parece deficiente, comprueba que tus imágenes tengan al menos 200 ppp utilizando la guía de configuración de ppp. La comunidad de C# OCR en Stack Overflow también proporciona soluciones útiles para problemas comunes de proyectos de GitHub.

Para problemas específicos de configuración, utilice la herramienta de utilidades IronOCR para diagnosticar problemas y la guía general de resolución de problemas para un diagnóstico paso a paso.

¿Dónde puede obtener ayuda adicional?

Para obtener información detallada sobre la resolución de problemas, consulte la guía de resolución de problemas de IronOCR. El equipo de asistencia de IronOCR ofrece ayuda rápida a los usuarios con licencia que trabajan en aplicaciones de OCR alojadas en GitHub. Consulte el registro de cambios del producto para conocer las últimas actualizaciones.

¿Cuales son tus próximos pasos?

IronOCR simplifica la implementación de OCR en proyectos de C# en GitHub gracias a su API intuitiva, su preprocesamiento integrado y su fiabilidad. Empieza con los ejemplos de código anteriores, explora los repositorios oficiales y crea aplicaciones de procesamiento de documentos que aprovechen al máximo las funciones colaborativas de GitHub.

Tanto si está creando aplicaciones MAUI, procesando documentos especializados o implementando OCR en una sola línea de código, IronOCR le ofrece las herramientas que necesita. La compatibilidad multiplataforma de la biblioteca y su sencilla instalación mediante NuGet garantizan que su proyecto sea fácil de configurar para todos los colaboradores, independientemente de su entorno de desarrollo.

Descarga la versión de prueba gratuita de IronOCR para probarla hoy mismo en tu proyecto de GitHub. Explora las opciones de licencia, incluidas las ampliaciones y actualizaciones, para satisfacer las necesidades de tu equipo.

Preguntas Frecuentes

¿Cuál es el propósito principal del tutorial OCR C# GitHub?

El propósito principal del tutorial OCR C# GitHub es guiar a los desarrolladores en la implementación de reconocimiento de texto en sus proyectos de GitHub usando IronOCR. Incluye ejemplos de código y consejos sobre control de versiones.

¿Cómo puede IronOCR mejorar mis proyectos de C# en GitHub?

IronOCR puede mejorar tus proyectos de C# en GitHub al proporcionar poderosas capacidades de reconocimiento de texto, lo que te permite extraer y manipular texto de imágenes con alta precisión.

¿Cuáles son algunos beneficios de usar IronOCR para el reconocimiento de texto?

IronOCR ofrece varios beneficios para el reconocimiento de texto, incluyendo facilidad de uso, alta precisión e integración fluida en proyectos C#, lo que lo convierte en una opción ideal para desarrolladores que trabajan con datos de texto basados en imágenes.

¿Hay ejemplos de código disponibles en el tutorial OCR C# GitHub?

Sí, el tutorial OCR C# GitHub incluye ejemplos de código que demuestran cómo implementar el reconocimiento de texto usando IronOCR en tus proyectos.

¿Qué tipo de consejos de control de versiones se proporcionan en el tutorial?

El tutorial proporciona consejos de control de versiones para ayudar a gestionar los cambios en tus proyectos de manera efectiva al integrar IronOCR, asegurando una colaboración y mantenimiento del proyecto fluidos.

¿Puedo usar IronOCR para aplicaciones de reconocimiento de texto en tiempo real?

Sí, IronOCR se puede usar para aplicaciones de reconocimiento de texto en tiempo real, gracias a sus eficientes capacidades de procesamiento y soporte para varios formatos de imagen.

¿Qué formatos de imagen soporta IronOCR para el reconocimiento de texto?

IronOCR soporta una amplia gama de formatos de imagen para el reconocimiento de texto, incluyendo JPEG, PNG, BMP, GIF y TIFF, garantizando la compatibilidad con la mayoría de fuentes de imagen.

¿Existe una versión de prueba de IronOCR disponible para pruebas?

Sí, hay una versión de prueba de IronOCR disponible, permitiendo a los desarrolladores probar sus características y rendimiento en sus proyectos antes de comprometerse a una compra.

¿Cómo maneja IronOCR diferentes idiomas en el reconocimiento de texto?

IronOCR soporta múltiples idiomas para el reconocimiento de texto, permitiendo a los desarrolladores extraer texto de imágenes en varios idiomas con facilidad.

¿Cuáles son los requisitos del sistema para usar IronOCR en proyectos C#?

IronOCR es compatible con .NET Framework y .NET Core, y se puede integrar fácilmente en proyectos C# sin requerir amplios recursos del sistema.

Kannaopat Udonpant
Ingeniero de Software
Antes de convertirse en Ingeniero de Software, Kannapat completó un doctorado en Recursos Ambientales de la Universidad de Hokkaido en Japón. Mientras perseguía su grado, Kannapat también se convirtió en miembro del Laboratorio de Robótica de Vehículos, que es parte del Departamento de Ingeniería ...
Leer más

Equipo de soporte de Iron

Estamos disponibles online las 24 horas, 5 días a la semana.
Chat
Email
Llámame