Saltar al pie de página
HERRAMIENTAS DE EXCEL

Cómo usar Python para Leer Archivos de Excel

Los archivos de Microsoft Excel son esenciales para almacenar y organizar datos importantes en el entorno actual orientado a los datos. Los archivos de Excel pueden incluir datos financieros, datos de ventas o resultados de investigaciones científicas, y se utilizan ampliamente en muchos negocios diferentes.

Python tiene un entorno robusto de bibliotecas que hace posible leer y manipular archivos de Excel con facilidad. Esta publicación examinará cómo usar Python para leer archivos de Excel.

También veremos cómo IronXL es un fuerte sustituto de las bibliotecas de Python al leer archivos de Excel en C# en esta publicación. Exploraremos sus características, usabilidad y ventajas de rendimiento mientras mostramos sus capacidades con ejemplos de código útiles.

Cómo usar Python para leer archivos de Excel

  1. Incorporar las bibliotecas necesarias.
  2. Para leer el archivo de Excel, utiliza la función en la biblioteca.
  3. Si es necesario, incluye parámetros adicionales como el nombre de la hoja o el rango además de la ubicación del archivo.
  4. Coloca la información en una variable.
  5. Realiza el procesamiento o limpieza de datos como un paso opcional.
  6. Procede a analizar o manipular los datos.

Lector de Excel de Pandas

Una biblioteca especializada llamada Pandas-Excel-Reader fue desarrollada sobre Pandas y proporciona capacidades mejoradas para leer archivos de Excel. Al igual que la función integrada read_excel() de Pandas, ofrece una interfaz de alto nivel para extraer datos de una hoja de cálculo de Excel en DataFrames de Pandas.

Por otro lado, Pandas-Excel-Reader proporciona características adicionales, incluyendo carga de datos más rápida, soporte mejorado para archivos grandes de Excel y compatibilidad con versiones anteriores de Pandas.

Los desarrolladores que trabajan con grandes conjuntos de datos o experimentan problemas de velocidad al usar el método regular Pandas read_excel() pueden encontrar este paquete especialmente útil.

Cómo usar Python para Leer Archivos de Excel: Figura 1

PyExcelerate

PyExcelerate es un pequeño módulo de Python que produce archivos de Excel rápidamente y con poco uso de memoria. Aunque PyExcelerate se centra principalmente en la creación de archivos de Excel, también tiene funciones para leer archivos de Excel.

PyExcelerate permite a los desarrolladores importar datos en estructuras de datos de Python, incluidas listas y diccionarios, desde archivos de Excel preexistentes. El enfoque de PyExcelerate en eficiencia y rapidez lo hace apropiado para actividades que implican lectura rápida de Excel, como análisis de datos o generación de informes.

Cómo usar Python para Leer Archivos de Excel: Figura 2

Escritor de Excel de Pandas

Una biblioteca complementaria a Pandas, Pandas-Excel-Writer está hecha específicamente para crear archivos de Excel. Aunque la exportación de DataFrames de Pandas a Excel es su función principal, Pandas-Excel-Writer también puede leer datos de archivos de Excel preexistentes.

Los desarrolladores tienen flexibilidad y control sobre el proceso de extracción de datos usando Pandas-Excel-Writer para extraer datos de ciertas hojas de cálculo o rangos dentro de los archivos de Excel.

La integración fluida de Pandas-Excel-Writer con Pandas facilita la lectura y escritura de archivos de Excel, permitiendo a los desarrolladores gestionar eficientemente archivos de Excel en aplicaciones de Python.

Tabla XL

Una biblioteca de Python ligera llamada XlTable se centra en la usabilidad y simplicidad en su diseño para leer y modificar tablas de Excel. Los desarrolladores pueden extraer datos, aplicar filtros y realizar acciones básicas en los datos de la tabla utilizando esta interfaz de alto nivel para trabajar con tablas de Excel.

Aunque XlTable carece de algunas de las funciones avanzadas de ciertas otras bibliotecas, proporciona un método fácil de usar para manipular tablas de Excel, lo que lo hace apropiado para tareas básicas de lectura de Excel o proyectos con poco código.

Cómo usar Python para Leer Archivos de Excel: Figura 3

Python-Excel

Leer, escribir y modificar documentos de Excel son todas posibles con la ayuda de Python-Excel, una biblioteca de Python con muchas características para trabajar con archivos de Excel. Python-Excel ofrece un conjunto robusto de funciones para el procesamiento de archivos de Excel y la extracción de datos, aunque no es tan popular como algunas otras bibliotecas.

Los desarrolladores pueden usar Python-Excel para crear informes, extraer datos de archivos de Excel y llevar a cabo operaciones de análisis de datos. Python-Excel proporciona a los desarrolladores que buscan una solución completa para manipular archivos de Excel en Python una poderosa API y una gran cantidad de documentación. Es una opción competitiva.

Cómo usar Python para Leer Archivos de Excel: Figura 4

IronXL

IronXL es una biblioteca de C# rica en funciones para manipular archivos de Excel. IronXL, creada por Iron Software, ofrece un rango completo de características para leer, editar y modificar documentos de Excel programáticamente.

IronXL ofrece a los desarrolladores una experiencia fluida para actividades relacionadas con Excel al simplificar las interacciones de Excel en C# con su API fácil de usar y documentación completa.

Características de IronXL

  • Amplio Soporte de Excel: IronXL es compatible con una gran cantidad de archivos de Excel y admite varios formatos de Excel, como archivos xlsx, xls y csv. IronXL tiene capacidades robustas de análisis, permitiendo a los desarrolladores extraer datos de manera efectiva, ya sea trabajando con hojas de cálculo de Excel modernas o formatos antiguos.
  • Alta Velocidad: IronXL da alta prioridad a la optimización de velocidad. Para garantizar interacciones de Excel confiables y rápidas, utiliza algoritmos efectivos y estrategias de gestión de memoria. Los desarrolladores pueden procesar fácilmente grandes archivos de Excel ya que IronXL ha reducido el uso de memoria y optimizado las velocidades de procesamiento.
  • API Sencilla y Fácil de Usar: La API simple y fácil de usar de IronXL lo hace adecuado para desarrolladores de todos los niveles de experiencia. IronXL simplifica el proceso de leer y escribir archivos de Excel y reduce la curva de aprendizaje para los desarrolladores de C# al proporcionar métodos simples para leer archivos de Excel, acceder a libros de trabajo de Excel y recuperar datos de las celdas.
  • Control Detallado: IronXL ofrece a los desarrolladores un control detallado sobre los documentos de Excel, permitiéndoles trabajar con archivos de Excel hasta el nivel de celda, en contraste con ciertas bibliotecas de nivel superior. Con la capacidad de acceder a celdas individuales, filas, columnas y hojas de cálculo, los desarrolladores pueden extraer y manipular datos con precisión para satisfacer necesidades específicas.
  • Compatibilidad Multiplataforma: IronXL es apropiado para la programación en C# multiplataforma ya que funciona con una variedad de sistemas operativos, como Windows, Linux y macOS. Para interacciones de Excel consistentes en varios entornos, los desarrolladores pueden confiar en IronXL, ya sea que estén creando aplicaciones de escritorio, web o móviles.

Para saber más sobre la documentación de IronXL refiérase aquí.

Instalación de IronXL

Para instalar IronXL, usa la línea de comandos y estas instrucciones.

Ve a Herramientas -> Gestión del Paquete NuGet -> Interfaz del gestor de paquetes en Visual Studio.

Introduce el siguiente código en la pestaña de consola del gestor de paquetes:

pip install IronXL

El archivo ahora está descargado e instalado en el proyecto activo, y está listo para usarse.

IronXL en C#: Lectura de datos de Excel

Veamos ahora un ejemplo de código útil que te muestra cómo usar IronXL en C# para leer datos de Excel. Revisaremos cómo abrir un archivo de Excel que ya existe, obtener datos de la hoja de cálculo y extraer valores de ciertas celdas:

using IronXL;
class Program
{
    static void Main(string[] args)
    {
        // Specify the path to the xlsx file
        string filePath = "SampleData.xlsx";

        // Create a new WorkBook object
        WorkBook workBook = WorkBook.Load(filePath);

        // Get the first worksheet from the Excel file
        WorkSheet workSheet = workBook.WorkSheets.First();

        // Retrieve data from specific cells
        string cellA1 = workSheet["A1"].Value.ToString();
        string cellB1 = workSheet["B1"].Value.ToString();

        // Display the retrieved data
        Console.WriteLine("Value of cell A1: " + cellA1);
        Console.WriteLine("Value of cell B1: " + cellB1);

        // Close the workbook
        workBook.Close();
    }
}
using IronXL;
class Program
{
    static void Main(string[] args)
    {
        // Specify the path to the xlsx file
        string filePath = "SampleData.xlsx";

        // Create a new WorkBook object
        WorkBook workBook = WorkBook.Load(filePath);

        // Get the first worksheet from the Excel file
        WorkSheet workSheet = workBook.WorkSheets.First();

        // Retrieve data from specific cells
        string cellA1 = workSheet["A1"].Value.ToString();
        string cellB1 = workSheet["B1"].Value.ToString();

        // Display the retrieved data
        Console.WriteLine("Value of cell A1: " + cellA1);
        Console.WriteLine("Value of cell B1: " + cellB1);

        // Close the workbook
        workBook.Close();
    }
}
Imports IronXL
Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Specify the path to the xlsx file
		Dim filePath As String = "SampleData.xlsx"

		' Create a new WorkBook object
		Dim workBook As WorkBook = WorkBook.Load(filePath)

		' Get the first worksheet from the Excel file
		Dim workSheet As WorkSheet = workBook.WorkSheets.First()

		' Retrieve data from specific cells
		Dim cellA1 As String = workSheet("A1").Value.ToString()
		Dim cellB1 As String = workSheet("B1").Value.ToString()

		' Display the retrieved data
		Console.WriteLine("Value of cell A1: " & cellA1)
		Console.WriteLine("Value of cell B1: " & cellB1)

		' Close the workbook
		workBook.Close()
	End Sub
End Class
$vbLabelText   $csharpLabel

Comenzamos definiendo la ruta al archivo de Excel ("SampleData.xlsx") en este ejemplo de código. Luego, usamos la función Load() de IronXL para construir un nuevo objeto WorkBook y suministrar la ubicación del archivo como entrada.

Se abre entonces la primera hoja de Excel desde el archivo de Excel, y usamos referencias de celdas (como "A1" y "B1") para acceder a ciertas celdas. Por último, usamos la función Console.WriteLine() para mostrar los datos que hemos recuperado de estos valores de celda. También usamos IronXL para leer múltiples hojas de Excel.

Para el ejemplo de código anterior, hemos creado un nuevo libro de trabajo de Excel como se muestra en la imagen a continuación.

Cómo usar Python para Leer Archivos de Excel: Figura 5

A continuación se muestra la salida generada a partir del código anterior. Para saber más sobre el código de IronXL, consulta aquí.

Cómo usar Python para Leer Archivos de Excel: Figura 6

Conclusión

La capacidad de Python para leer e importar archivos Excel abre un mundo de posibilidades para la elaboración de informes, automatización y análisis de datos. Los datos de los archivos Excel pueden ser fácilmente extraídos, modificados y analizados por programadores de Python.

A través de la adhesión a prácticas recomendadas y la utilización de las funcionalidades de estas bibliotecas, los desarrolladores pueden optimizar sus procesos para leer archivos de Excel y descubrir importantes insights ocultos en sus datos.

Por otro lado, IronXL es un potente sustituto para la lectura de archivos Excel para desarrolladores de C#, ofreciendo compatibilidad completa con Excel, excelente rendimiento e interacción fluida con el marco .NET.

IronXL hace más simples las interacciones de Excel en C# con su API fácil de usar y control detallado sobre los documentos de Excel. Esto ayuda a los desarrolladores a gestionar los datos de Excel eficientemente en sus aplicaciones, ya sea que estén trabajando con múltiples hojas o archivos o con una sola hoja de cálculo de Excel.

Los desarrolladores de C# pueden depender de IronXL para simplificar los procesos relacionados con Excel y habilitar la funcionalidad completa de Excel dentro de sus programas C#, independientemente de si están creando aplicaciones de escritorio, web o móviles.

Para $799, IronXL está disponible al lanzamiento. Los usuarios que deseen actualizaciones y asistencia del producto también pueden optar por pagar una cuota de suscripción anual. Por una tarifa adicional, IronXL ofrece seguridad para la redistribución ilimitada. Para conocer más sobre el costo aproximado, consulta este enlace.

Ve más sobre Iron Software haciendo clic en este enlace.

Curtis Chau
Escritor Técnico

Curtis Chau tiene una licenciatura en Ciencias de la Computación (Carleton University) y se especializa en el desarrollo front-end con experiencia en Node.js, TypeScript, JavaScript y React. Apasionado por crear interfaces de usuario intuitivas y estéticamente agradables, disfruta trabajando con frameworks modernos y creando manuales bien ...

Leer más