Pruebe en producción sin marcas de agua.
Funciona donde lo necesite.
Obtén 30 días de producto totalmente funcional.
Ténlo en funcionamiento en minutos.
Acceso completo a nuestro equipo de asistencia técnica durante la prueba del producto
Trabajar con archivos Excel es un requisito habitual en las tareas de análisis y automatización de datos. Python, con su extenso conjunto de bibliotecas, ofrece varias formas de interactuar con archivos XLSX. En este tutorial, aprenderemos cómo leer archivos de Excel usando IronXL, una biblioteca de Excel para Python.
IronXL Python está diseñado para ayudar a los desarrolladores a leer y escribir archivos de Excel fácilmente en Python. No sólo puedes escribir archivos de Excel, sino que también puedes trabajar con varias hojas de Excel de una sola vez. Esta biblioteca es perfecta para escribir archivos Excel sin instalar Microsoft Excel en su máquina.
Cuando necesites importar datos directamente a una hoja de cálculo de Excel, IronXL viene al rescate. IronXL simplifica el manejo de las hojas de cálculo de Excel. Ayuda a gestionar fácilmente los datos de varias hojas de un archivo XLSX.
Veamos cómo podemos leer archivos Excel en Python usando IronXL.
Los siguientes pasos repasan el proceso de lectura de archivos Excel en Python.
Crear un archivo Python en código Visual Studio.
Instala la biblioteca Excel de Python con pip.
Cargar el archivo Excel que necesitamos leer
Iterar datos de Excel mediante bucles
Antes de sumergirte en el tutorial, asegúrate de tener instalados en tu sistema los siguientes requisitos previos:
Abre Visual Studio Code y crea un nuevo archivo de Python llamado ReadExcel.py. Este archivo contendrá nuestro script para leer archivos Excel usando IronXL.
Abra la línea de comandos en Visual Studio Code seleccionando en el menú Terminal > Nueva terminal.
Instale IronXL ejecutando el siguiente comando:
pip install IronXL
¡Cómo Leer Archivos de Excel en Python: Figura 3
Ahora, dividamos el código en secciones y expliquemos cada parte.
from ironxl import * import sys
Aquí, importamos todo de la biblioteca ironxl, que proporciona la funcionalidad para trabajar con archivos Excel. sys se utiliza para establecer la ruta donde está instalado Python, lo cual es necesario para que IronXL funcione correctamente.
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix se asigna a la ruta del directorio de instalación de Python. Es un paso preparatorio que puede no ser necesario en todos los entornos, pero que es esencial en algunas configuraciones para evitar problemas relacionados con la ruta.
License.LicenseKey = "License-Key";
La biblioteca IronXL requiere una clave de licencia válida para desbloquear todas sus funciones. Esta línea de código License.LicenseKey = "License-Key"; es donde insertarías tu clave de licencia obtenida. Sin una licencia válida, IronXL no funcionará.
workbook = WorkBook.Load("data.xlsx")
En esta sección del script, workbook = WorkBook.Load("data.xlsx"), se demuestra cómo cargar un libro de Excel. WorkBook.Load es un método proporcionado por IronXL para abrir un archivo de Excel existente, especificado por su ruta de archivo.
El ejemplo utiliza "data.xlsx", asumiendo que este archivo se encuentra en el mismo directorio que el script. Si el archivo se encuentra en otro lugar, deberá indicar la ruta completa del archivo.
worksheet = workbook.WorkSheets[0]
Después de cargar el libro de trabajo, el siguiente paso es seleccionar una hoja de trabajo. La línea workbook.WorkSheets[0] accede a la primera hoja de cálculo en el archivo Excel. Las hojas de cálculo se indexan comenzando desde 0, por lo que este fragmento de código selecciona efectivamente la primera hoja.
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
Esta parte del script ejemplifica cómo leer y mostrar datos de celdas específicas. Al iterar sobre un rango de celdas para las celdas en la hoja de cálculo["A2:A5"], podemos acceder a la dirección y el valor de texto de cada celda. Puede recuperar información de áreas predefinidas dentro de una hoja.
IronXL proporciona funciones para realizar cálculos sencillos directamente en rangos de datos dentro de una hoja de Excel. Las siguientes secciones del código demuestran cómo realizar cálculos sencillos como la suma, el mínimo y el máximo en datos dentro de un rango especificado.
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
Esta parte del script demuestra cómo identificar valores únicos dentro de un rango especificado de una hoja Excel:
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
Para lograrlo, se utiliza la comprensión de conjuntos. Los conjuntos en Python son colecciones que eliminan automáticamente las entradas duplicadas, lo que las hace perfectas para encontrar valores únicos. La comprensión itera sobre cada celda en el rango F2:F10, accediendo al contenido de texto de cada celda usando cell.Text.
Al colocar esta iteración dentro de un conjunto, nos aseguramos de que sólo se conservan los valores únicos.
Por último, este fragmento cuenta cuántas veces aparece un valor específico en un intervalo determinado.
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
El objetivo aquí es cuantificar la ocurrencia de un valor específico, etiquetado aquí como specific_value. El código emplea una expresión generadora que itera sobre cada celda en el rango G2:G10, comparando el contenido de texto de la celda con specific_value.
La expresión cell.Text == specific_value se evalúa como True para cada celda que contiene el valor objetivo y False en caso contrario. La función sum suma estos valores booleanos, tratando True como 1 y False como 0, contando efectivamente el número de veces que ocurre el valor específico.
Aquí está el código completo para una mejor comprensión del código:
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
Después de ejecutar el archivo Python ReadExcel.py, verás la siguiente salida mostrada en tu consola, que refleja los resultados de las operaciones realizadas por el script en los datos de Excel.
En este tutorial, hemos explorado cómo configurar un entorno Python para utilizar IronXL para leer archivos de Excel. Hemos cubierto la instalación del software necesario, la escritura del script para cargar un libro de Excel, seleccionar una hoja de cálculo, leer los datos, realizar operaciones básicas de análisis de datos y mucho más.
IronXL proporciona una potente API para trabajar con archivos Excel en Python, lo que permite realizar tareas de análisis, limpieza y visualización de datos sin necesidad de Microsoft Excel.
Ya sea que esté analizando datos de ventas, importando datos para informes o creando visualizaciones a partir de datos de Excel, IronXL ofrece una solución sólida para gestionar archivos de Excel en aplicaciones Python.
IronXL ofrece una prueba gratuita para que los usuarios exploren sus características, con licencias a partir de $749 para aquellos que estén listos para integrar completamente sus capacidades.