USO DE IRONXL FOR PYTHON

Leer archivo de Excel en Python sin Pandas (No se necesita Interop)

Publicado en 14 de enero, 2025
Compartir:

Introducción

LecturaMicrosoft Excel archivos enPythones una habilidad esencial para varias tareas relacionadas con datos y se ha convertido en una práctica estándar en campos como la ciencia de datos, el análisis de datos, la inteligencia empresarial y la automatización. Excel es una de las herramientas más comúnmente utilizadas para almacenar y organizar datos debido a su interfaz fácil de usar y sus amplias funcionalidades. Al tratar con Microsoft Excel, pandases la primera biblioteca que viene a la mente, pero hay otras bibliotecas robustas como IronXLque ofrecen rendimiento y velocidad.

IronXLpara Python es una biblioteca robusta diseñada para trabajar con archivos de Excel. Permite a los desarrolladores crear, leer, analizar datos y manipular hojas de cálculo de Excel sin dificultades. Las principales ventajas de utilizar IronXL incluyen su facilidad de uso, potentes funcionalidades, y el hecho de que no requiere que Microsoft Excel esté instalado en el servidor.

Cómo leer un archivo de Excel en Python sin Pandas utilizando IronXL.

Paso 1: Importar la biblioteca IronXL.

Paso 2: Agregar clave de licencia.

Paso 3: Cargue el archivo de Excel.

Paso 4: Leer archivos de Excel usando IronXL.

Presentando IronXL

Leer archivo Excel en Python sin Pandas (no se necesita Interop): Figura 1

IronXLproporciona características robustas para manejar archivos de Excel, incluido el soporte para múltiples hojas, el formato de celdas, la lectura y escritura de diferentes formatos de archivo(como .xlsx y .xls), y trabajar con grandes conjuntos de datos, lo que lo convierte en una herramienta versátil para tareas de manipulación de datos.

Características clave de la biblioteca IronXL para Python

  1. Manejo Fácil de Archivos Excel: IronXL simplifica el proceso delectura, escritura y edición de archivos Excel en Python. Usando IronXL puedes manipular archivos de Excel yguardarlos con facilidad. También admite archivos CSV, archivos XLS.

  2. Soporte de hojas múltiples: IronXL puede leer y escribir datos fácilmente a través de múltiples hojas dentro de un solo libro de Excel. Esto es ideal al trabajar con archivos de Excel que contienen diferentes tipos de datos o informes en varias hojas.

    1. Leer y Escribir Datos:

      • Lectura de Datos: IronXL permite acceder a celdas individuales o filas y columnas enteras en un archivo de Excel. Soporta la lectura de valores desde todo tipo de celdas, incluyendo texto, números y fechas.
    • Escritura de Datos: La biblioteca permite escribir archivos de Excel, ya sea que necesite actualizar celdas existentes o agregar nuevos datos al archivo. También admite el formato csv sin necesidad de importar csv, archivos XLSX.
  3. Formato de celdas: IronXL proporciona la capacidad de formatear celdas de Excel. Puede configurar el color del texto, el tamaño de la fuente, los bordes y otros estilos visuales directamente dentro del script de Python. Esto es útil para crear informes con un formato específico o cuando necesitas resaltar ciertos puntos de datos.

  4. Compatibilidad con varios formatos de Excel:IronXLpuede manejar múltiples formatos de archivo de Excel, incluyendo el formato de archivo .xlsx, el formato de archivo .xls y el formato de archivo .csv. Esto lo convierte en una opción versátil para interactuar con archivos de Excel que son compartidos o exportados desde varios sistemas.

  5. Soporte para archivos grandes: IronXL está optimizado para manejar archivos de Excel grandes con muchas filas y columnas, lo que lo hace adecuado para tareas de análisis de datos que implican conjuntos de datos masivos.

  6. Multiplataforma: MientrasIronXLestá construido sobre tecnologías .NET, es multiplataforma y se puede utilizar en Windows, macOS y Linux a través de Python.

Paso 1: Importar la biblioteca IronXL

ImportarIronXLusando el gestor de paquetes de Python para leer datos de hojas de cálculo de Excel

pip install ironxl
pip install ironxl
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'pip install ironxl
VB   C#

El siguiente paso es importar las bibliotecas necesarias de IronXL:

from ironxl import License, WorkBook, WorkSheet
PYTHON

Paso 2: Agregar clave de licencia

IronXL necesita una clave de licencia, obtén tu licencia gratuita de aquíy coloca la licencia en la parte superior del código.

License.LicenseKey = "Your Key"
PYTHON

Paso 3: Cargar el archivo Excel

Cargue el archivo Excel usando WorkBook.Load.() función. Este método devuelve un objeto Workbook, que representa todo el archivo Excel.

workbook = WorkBook.Load('sample.xlsx')
PYTHON

Paso 4: Leer archivos Excel usando IronXL

Ahora, utilizando el objeto del libro de trabajo, lee las hojas y luego lee los datos en las hojas.

for sheet in workbook.WorkSheets:
    print(f"Sheet Name: {sheet.Name}")
    for row in sheet.Rows:
        print([cell.Value for cell in row]) # excel data
PYTHON

Código completo

Archivo de entrada de Excel

Leer archivo de Excel en Python sin Pandas (no se necesita Interop): Figura 2

from ironxl import License, WorkBook, WorkSheet
License.LicenseKey = "Your Key"
# Load the Excel workbook
workbook = WorkBook.Load('sample.xlsx')
# Read Multiple Sheets
for sheet in workbook.WorkSheets:
    print(f"Sheet Name: {sheet.Name}")
    for row in sheet.Rows:
        print([cell.Value for cell in row])
PYTHON

Código Explicación

El código proporcionado demuestra cómo usar IronXL para leer datos de un archivo Excel con múltiples hojas. Aquí tienes una explicación del código paso a paso:

1. Configuración de la Clave de Licencia

La primera línea del código configura la licencia de IronXL especificando la clave de licencia mediante la propiedad License.LicenseKey. Esto es necesario para activar la biblioteca IronXL y asegurarse de que pueda usarse sin restricciones.

2. Cargando el libro de Excel

La segunda línea utiliza el método WorkBook.Load()método para cargar un archivo Excel(sample.xlsx)en un objeto WorkBook. Este objeto representa todo el libro de trabajo.(es decir, el archivo de Excel)y contiene todas las hojas y datos dentro del archivo.

3. Iterar a través de las hojas

El código luego comienza un bucle a través de las hojas en el libro de trabajo. La propiedad WorkBook.WorkSheets ofrece acceso a todas las hojas del libro de trabajo cargado. Para cada hoja, imprime el nombre de la hoja utilizando sheet Name. Esto es útil para identificar qué hoja se está procesando, especialmente cuando se trabaja con múltiples hojas.

4. Leer e imprimir datos de cada hoja

Dentro de cada hoja, el código itera a través de cada fila utilizando sheet.Rows. Cada fila es una colección de celdas en esa fila específica. El código luego extrae el valor de cada celda en la fila usando cell.Value, y lo imprime como una lista para cada fila.

Salida

Leer archivo Excel en Python sin Pandas (No se necesita Interop): Figura 3

IronXL License(Prueba Disponible)

IronXL funciona con una clave de licencia válida en el código. Los usuarios pueden obtener fácilmente una licencia de prueba desde el página de licencia. Para usar la licencia, coloque la licencia en algún lugar del código como se muestra a continuación antes de utilizar la biblioteca IronXL.

ironxl.License.LicenseKey = "Your License Key"
PYTHON

Conclusión

IronXLes la mejor alternativa al módulo pandas cuando se trata de manejar archivos Excel. Proporciona una forma poderosa y sencilla de manejar archivos Excel en Python sin necesidad de importar pandas. Admite varios formatos de Excel, lo que lo convierte en una excelente opción para desarrolladores que buscan automatizar tareas de procesamiento de datos y generación de informes. Los desarrolladores que buscan una alternativa a pandas pueden comenzar a usar fácilmenteIronXLque tiene soporte completo para leer, escribir y manipular hojas de Excel.

< ANTERIOR
Cómo leer un archivo de Excel en Python con múltiples hojas
SIGUIENTE >
Cómo insertar una imagen en Excel usando Python