Pruebe en producción sin marcas de agua.
Funciona donde lo necesite.
Obtén 30 días de producto totalmente funcional.
Ténlo en funcionamiento en minutos.
Acceso completo a nuestro equipo de asistencia técnica durante la prueba del producto
Leer archivos de Microsoft Excel en Python es una habilidad esencial para diversas tareas relacionadas con datos y se ha convertido en una práctica estándar en campos como la ciencia de datos, el análisis de datos, la inteligencia empresarial y la automatización. Excel es una de las herramientas más comúnmente utilizadas para almacenar y organizar datos debido a su interfaz fácil de usar y sus amplias funcionalidades. Al trabajar con Microsoft Excel, pandas es la primera biblioteca que viene a la mente, pero hay otras bibliotecas robustas como IronXL que ofrecen rendimiento y velocidad.
IronXL for Python es una biblioteca robusta diseñada para trabajar con archivos Excel. Permite a los desarrolladores crear, leer, analizar datos y manipular hojas de cálculo de Excel sin dificultades. Las principales ventajas de utilizar IronXL incluyen su facilidad de uso, potentes funcionalidades, y el hecho de que no requiere que Microsoft Excel esté instalado en el servidor.
Paso 1: Importar la biblioteca IronXL.
Paso 2: Agregar clave de licencia.
Paso 3: Cargue el archivo de Excel.
Paso 4: Leer archivos de Excel usando IronXL.
IronXL ofrece características robustas para manejar archivos de Excel, incluyendo soporte para múltiples hojas, formato de celdas, lectura y escritura de diferentes formatos de archivo (como .xlsx y .xls), y trabajo con grandes conjuntos de datos, lo que lo convierte en una herramienta versátil para tareas de manipulación de datos.
Manejo fácil de archivos Excel: IronXL simplifica el proceso de lectura, escritura y edición de archivos Excel en Python. Usando IronXL, puedes manipular archivos de Excel y guardarlos con facilidad. También admite archivos CSV, archivos XLS.
Soporte para Múltiples Hojas: IronXL puede leer y escribir datos fácilmente en múltiples hojas dentro de un solo libro de Excel. Esto es ideal al trabajar con archivos de Excel que contienen diferentes tipos de datos o informes en varias hojas.
Leer y escribir datos:
Formato de celdas: IronXL ofrece la capacidad de formatear celdas de Excel. Puede configurar el color del texto, el tamaño de la fuente, los bordes y otros estilos visuales directamente dentro del script de Python. Esto es útil para crear informes con un formato específico o cuando necesitas resaltar ciertos puntos de datos.
Compatibilidad con varios formatos de Excel: IronXL puede manejar múltiples formatos de archivo de Excel, incluidos los formatos de archivo .xlsx, .xls y .csv. Esto lo convierte en una opción versátil para interactuar con archivos de Excel que son compartidos o exportados desde varios sistemas.
Soporte para archivos grandes: IronXL está optimizado para manejar archivos Excel grandes con muchas filas y columnas, lo que lo hace adecuado para tareas de análisis de datos que involucran conjuntos de datos masivos.
Importe IronXL utilizando el gestor de paquetes de Python para leer datos de hojas de cálculo de Excel
pip install ironxl
El siguiente paso es importar las bibliotecas necesarias de IronXL:
from ironxl import License, WorkBook, WorkSheet
IronXL necesita una clave de licencia, obtén tu licencia gratuita aquí y coloca la licencia en la parte superior del código.
License.LicenseKey = "Your Key"
Cargue el archivo de Excel usando la función WorkBook.Load(). Este método devuelve un objeto Workbook, que representa todo el archivo Excel.
workbook = WorkBook.Load('sample.xlsx')
Ahora, utilizando el objeto del libro de trabajo, lee las hojas y luego lee los datos en las hojas.
for sheet in workbook.WorkSheets:
print(f"Sheet Name: {sheet.Name}")
for row in sheet.Rows:
print([cell.Value for cell in row]) # excel data
from ironxl import License, WorkBook, WorkSheet
License.LicenseKey = "Your Key"
# Load the Excel workbook
workbook = WorkBook.Load('sample.xlsx')
# Read Multiple Sheets
for sheet in workbook.WorkSheets:
print(f"Sheet Name: {sheet.Name}")
for row in sheet.Rows:
print([cell.Value for cell in row])
El código proporcionado demuestra cómo usar IronXL para leer datos de un archivo Excel con múltiples hojas. Aquí tienes una explicación del código paso a paso:
La primera línea del código configura la licencia de IronXL especificando la clave de licencia mediante la propiedad License.LicenseKey. Esto es necesario para activar la biblioteca IronXL y asegurarse de que pueda usarse sin restricciones.
La segunda línea utiliza el método WorkBook.Load() para cargar un archivo de Excel (sample.xlsx) en un objeto WorkBook. Este objeto representa el libro completo (es decir, el archivo de Excel) y contiene todas las hojas y datos dentro del archivo.
El código luego comienza un bucle a través de las hojas en el libro de trabajo. La propiedad WorkBook.WorkSheets ofrece acceso a todas las hojas del libro de trabajo cargado. Para cada hoja, imprime el nombre de la hoja utilizando sheet Name. Esto es útil para identificar qué hoja se está procesando, especialmente cuando se trabaja con múltiples hojas.
Dentro de cada hoja, el código itera a través de cada fila utilizando sheet.Rows. Cada fila es una colección de celdas en esa fila específica. El código luego extrae el valor de cada celda en la fila usando cell.Value, y lo imprime como una lista para cada fila.
IronXL funciona con una clave de licencia válida en el código. Los usuarios pueden obtener fácilmente una licencia de prueba desde la página de licencias. Para usar la licencia, coloque la licencia en algún lugar del código como se muestra a continuación antes de utilizar la biblioteca IronXL.
ironxl.License.LicenseKey = "Your License Key"
IronXL es la mejor alternativa al módulo pandas cuando se trata de manejar archivos de Excel. Proporciona una forma poderosa y sencilla de manejar archivos Excel en Python sin necesidad de importar pandas. Admite varios formatos de Excel, lo que lo convierte en una excelente opción para desarrolladores que buscan automatizar tareas de procesamiento de datos y generación de informes. Los desarrolladores que buscan una alternativa a pandas pueden comenzar fácilmente a usar IronXL, que tiene soporte completo para leer, escribir y manipular hojas de Excel.