Saltar al pie de página
USANDO IRONXL PARA PYTHON

Leer Archivo de Excel en Python Sin Pandas (No Se Necesita Interop)

Leer archivos de Microsoft Excel en Python es una habilidad esencial para varias tareas relacionadas con datos y se ha convertido en una práctica estándar en campos como ciencia de datos, análisis de datos, inteligencia empresarial y automatización. Excel es una de las herramientas más comúnmente utilizadas para almacenar y organizar datos debido a su interfaz amigable y características extensas. Al trabajar con Microsoft Excel, pandas es la primera biblioteca que viene a la mente, pero hay otras bibliotecas robustas como IronXL que brindan rendimiento y velocidad.

IronXL para Python es una biblioteca robusta diseñada para trabajar con archivos Excel. Permite a los desarrolladores crear, leer, analizar datos y manipular hojas de cálculo de Excel sin problemas. Las principales ventajas de usar IronXL incluyen su facilidad de uso, potentes funcionalidades y el hecho de no requerir la instalación de Microsoft Excel en el servidor.

Cómo leer un archivo de Excel en Python sin Pandas usando IronXL

Paso 1: Importar la Biblioteca IronXL.

Paso 2: Agregar Clave de Licencia.

Paso 3: Cargar el Archivo de Excel.

Paso 4: Leer archivos Excel usando IronXL.

Presentamos IronXL

Leer Archivo de Excel en Python Sin Pandas (No Se Necesita Interoperabilidad): Figura 1

IronXL ofrece características robustas para manejar archivos Excel, incluyendo soporte para múltiples hojas, formateo de celdas, lectura y escritura de diferentes formatos de archivo (como .xlsx y .xls), y trabajo con grandes conjuntos de datos, haciéndolo una herramienta versátil para tareas de manipulación de datos.

Características principales de la biblioteca IronXL para Python

  1. Manejo Fácil de Archivos Excel: IronXL simplifica el proceso de lectura, escritura y edición de archivos Excel en Python. Usando IronXL, puedes manipular archivos Excel y guardarlos con facilidad. También soporta archivos CSV y archivos XLS.
  2. Soporte para Múltiples Hojas: IronXL puede leer y escribir fácilmente datos a través de múltiples hojas dentro de un libro de Excel. Esto es ideal cuando se trata de archivos Excel que contienen diferentes tipos de datos o informes en varias hojas.
  3. Leer y Escribir Datos:
    • Leer Datos: IronXL te permite acceder a celdas individuales o filas y columnas enteras en un archivo Excel. Soporta la lectura de valores de todo tipo de celdas, incluyendo texto, números y fechas.
    • Escribir Datos: La biblioteca soporta la escritura de archivos Excel, ya sea que necesites actualizar celdas existentes o agregar nuevos datos al archivo. También soporta el formato CSV sin importar el módulo CSV, archivos XLSX.
  4. Formato de Celdas: IronXL proporciona la capacidad de formatear celdas de Excel. Puedes establecer el color de texto, tamaño de fuente, bordes y otros estilos visuales directamente en el script de Python. Esto es útil para crear informes con un formato específico o cuando necesitas resaltar ciertos puntos de datos.
  5. Compatibilidad con Varios Formatos de Excel: IronXL puede manejar múltiples formatos de archivos Excel, incluyendo el formato de archivo .xlsx, formato de archivo .xls y formato de archivo .csv. Esto lo convierte en una opción versátil para interactuar con archivos Excel que se comparten o exportan desde varios sistemas.
  6. Soporte para Archivos Grandes: IronXL está optimizado para manejar archivos Excel grandes con muchas filas y columnas, haciéndolo adecuado para tareas de análisis de datos que involucran conjuntos de datos masivos.
  7. Multiplataforma: Aunque IronXL está construido sobre tecnologías .NET, es multiplataforma y puede ser usado en Windows, macOS y Linux a través de Python.

Paso 1: Importar la biblioteca IronXL

Importa IronXL usando el gestor de paquetes de Python para leer datos de hojas de cálculo Excel.

pip install ironxl
pip install ironxl
SHELL

A continuación, importa las bibliotecas necesarias desde IronXL:

from ironxl import License, WorkBook, WorkSheet
from ironxl import License, WorkBook, WorkSheet
PYTHON

Paso 2: Agregar clave de licencia

IronXL necesita una clave de licencia. Obtén tu licencia gratuita desde aquí y coloca la licencia en la parte superior del código.

License.LicenseKey = "Your Key"
License.LicenseKey = "Your Key"
PYTHON

Paso 3: Cargue el archivo Excel

Carga el archivo de Excel usando la función WorkBook.Load(). Este método devuelve un objeto Workbook, que representa el archivo Excel completo.

# Load the workbook
workbook = WorkBook.Load('sample.xlsx')
# Load the workbook
workbook = WorkBook.Load('sample.xlsx')
PYTHON

Paso 4: Leer archivos de Excel con IronXL

Ahora usa el objeto del libro de trabajo para leer las hojas y luego leer los datos en las hojas.

# Iterate over all worksheets
for sheet in workbook.WorkSheets:
    print(f"Sheet Name: {sheet.Name}")
    for row in sheet.Rows:
        # Print each row's values
        print([cell.Value for cell in row]) # excel data
# Iterate over all worksheets
for sheet in workbook.WorkSheets:
    print(f"Sheet Name: {sheet.Name}")
    for row in sheet.Rows:
        # Print each row's values
        print([cell.Value for cell in row]) # excel data
PYTHON

Código completo

Archivo de entrada de Excel

Leer Archivo de Excel en Python Sin Pandas (No Se Necesita Interoperabilidad): Figura 2

from ironxl import License, WorkBook, WorkSheet

# Set the IronXL license key
License.LicenseKey = "Your Key"

# Load the Excel workbook
workbook = WorkBook.Load('sample.xlsx')

# Iterate through the sheets in the workbook
for sheet in workbook.WorkSheets:
    # Print the name of each sheet
    print(f"Sheet Name: {sheet.Name}")
    # Iterate through the rows in the current sheet
    for row in sheet.Rows:
        # Print each row's values as a list
        print([cell.Value for cell in row])
from ironxl import License, WorkBook, WorkSheet

# Set the IronXL license key
License.LicenseKey = "Your Key"

# Load the Excel workbook
workbook = WorkBook.Load('sample.xlsx')

# Iterate through the sheets in the workbook
for sheet in workbook.WorkSheets:
    # Print the name of each sheet
    print(f"Sheet Name: {sheet.Name}")
    # Iterate through the rows in the current sheet
    for row in sheet.Rows:
        # Print each row's values as a list
        print([cell.Value for cell in row])
PYTHON

Explicación del código

El código proporcionado demuestra cómo usar IronXL para leer datos de un archivo Excel con múltiples hojas. Aquí hay una explicación del código paso a paso:

1. Configuración de la clave de licencia

La primera línea del código configura la licencia de IronXL especificando la clave de licencia usando la propiedad License.LicenseKey. Esto se requiere para activar la biblioteca IronXL y asegurar que pueda ser utilizada sin restricciones.

2. Cargar el libro de Excel

La segunda línea usa el método WorkBook.Load() para cargar un archivo Excel (sample.xlsx) en un objeto WorkBook. Este objeto representa el libro completo (es decir, el archivo Excel) y contiene todas las hojas y datos dentro del archivo.

3. Iteración a través de hojas

El código entonces comienza un bucle a través de las hojas en el libro de trabajo. La propiedad WorkBook.WorkSheets da acceso a todas las hojas en el libro de trabajo cargado. Para cada hoja, imprime el nombre de la hoja usando sheet.Name. Esto es útil para identificar qué hoja se está procesando, especialmente cuando se trabaja con múltiples hojas.

4. Lectura e impresión de datos de cada hoja

Dentro de cada hoja, el código recorre cada fila usando sheet.Rows. Cada fila es una colección de celdas en esa fila específica. El código luego extrae el valor de cada celda en la fila usando cell.Value, y lo imprime como una lista por cada fila.

Resultado

Leer Archivo de Excel en Python Sin Pandas (No Se Necesita Interoperabilidad): Figura 3

Licencia IronXL (versión de prueba disponible)

IronXL funciona con una clave de licencia válida en el código. Los usuarios pueden obtener fácilmente una licencia de prueba desde la página de licencias. Para usar la licencia, coloca la licencia en algún lugar del código como se muestra a continuación antes de usar la biblioteca IronXL.

ironxl.License.LicenseKey = "Your License Key"
ironxl.License.LicenseKey = "Your License Key"
PYTHON

Conclusión

IronXL es la mejor alternativa al módulo pandas cuando se trata de manejar archivos Excel. Proporciona una forma poderosa y sencilla de manejar archivos Excel en Python sin la necesidad de importar pandas. Soporta varios formatos de Excel, lo que lo convierte en una excelente opción para desarrolladores que buscan automatizar tareas de procesamiento y elaboración de informes de datos. Los desarrolladores que buscan una alternativa a pandas pueden comenzar fácilmente a usar IronXL, que tiene soporte completo para leer, escribir y manipular hojas de Excel.

Preguntas Frecuentes

¿Cómo puedo leer un archivo Excel en Python sin usar pandas?

Puedes usar IronXL para leer archivos Excel en Python sin usar pandas. IronXL proporciona métodos para cargar archivos Excel y acceder a sus datos con facilidad, lo que lo convierte en una alternativa robusta.

¿Cuáles son los beneficios de usar IronXL para leer archivos Excel en Python?

IronXL ofrece ventajas de rendimiento y velocidad, no requiere que Microsoft Excel esté instalado, admite múltiples hojas y maneja grandes conjuntos de datos de manera eficiente, lo que lo hace beneficioso para tareas de procesamiento de datos.

¿Cómo instalo IronXL para usar en Python?

Para instalar IronXL en Python, usa el comando pip install ironxl para descargar y configurar la biblioteca en tu entorno de Python.

¿Puede IronXL manejar archivos Excel con múltiples hojas?

Sí, IronXL admite la lectura y escritura de datos en múltiples hojas dentro de un solo libro de trabajo de Excel, lo que lo hace adecuado para manejar conjuntos de datos complejos.

¿Es posible leer archivos Excel grandes usando IronXL?

IronXL está optimizado para manejar archivos Excel grandes con muchas filas y columnas, lo que lo hace adecuado para trabajar con extensos conjuntos de datos.

¿Cómo se configura una licencia para IronXL en Python?

Puedes configurar la clave de la licencia de IronXL en tu script de Python usando la propiedad License.LicenseKey. Se puede obtener una licencia de prueba de la página de licencias de IronXL.

¿Qué formatos de archivo puede leer IronXL en Python?

IronXL admite varios formatos de archivos Excel, incluidos .xlsx, .xls y .csv, lo que lo hace versátil para diferentes necesidades de procesamiento de datos.

¿Es IronXL una biblioteca multiplataforma?

Sí, IronXL es una biblioteca multiplataforma que se puede usar en Windows, macOS y Linux a través de Python, a pesar de estar construida sobre tecnologías .NET.

¿Cuál es el proceso para cargar un archivo Excel usando IronXL en Python?

Puedes cargar un archivo Excel usando el método WorkBook.Load() de IronXL, que devuelve un objeto WorkBook que representa todo el archivo Excel.

¿Cuáles son las características clave de IronXL para la manipulación de archivos Excel?

IronXL ofrece manejo fácil de archivos Excel, soporte para múltiples hojas, capacidades de lectura y escritura de datos, opciones de formato de celdas, compatibilidad con varios formatos de Excel y la capacidad de gestionar grandes conjuntos de datos de manera eficiente.

Curtis Chau
Escritor Técnico

Curtis Chau tiene una licenciatura en Ciencias de la Computación (Carleton University) y se especializa en el desarrollo front-end con experiencia en Node.js, TypeScript, JavaScript y React. Apasionado por crear interfaces de usuario intuitivas y estéticamente agradables, disfruta trabajando con frameworks modernos y creando manuales bien ...

Leer más