Ir para o conteúdo do rodapé
USANDO IRONXL FOR PYTHON

Como ler arquivos do Excel em Python

Trabalhar com arquivos Excel é um requisito comum em tarefas de análise de dados e automação. Python, com seu conjunto extenso de bibliotecas, oferece várias maneiras de interagir com arquivos XLSX. Neste tutorial, vamos aprender a ler arquivos Excel usando IronXL, uma biblioteca Excel for Python.

IronXL: Biblioteca Excel for Python

IronXL for Python é projetado para ajudar desenvolvedores a ler e escrever arquivos Excel facilmente em Python. Você não apenas pode escrever arquivos Excel, mas também trabalhar com múltiplas planilhas Excel de uma só vez. Esta biblioteca é perfeita para escrever arquivos Excel sem precisar instalar o Microsoft Excel na sua máquina.

Quando você precisa importar dados diretamente para uma planilha Excel, IronXL vem em seu auxílio. IronXL torna o manuseio de planilhas Excel simples. Ajuda a gerenciar dados em várias planilhas dentro de um arquivo XLSX facilmente.

Vamos ver como podemos ler arquivos Excel em Python usando IronXL.

Como Ler Arquivos Excel em Python

Os seguintes passos explicam o processo envolvido na leitura de arquivos Excel em Python.

  1. Crie um arquivo Python no Visual Studio Code.
  2. Instale a biblioteca Excel for Python usando pip.
  3. Carregue o arquivo Excel que precisamos ler.
  4. Itere os dados do Excel usando loops.
  5. Mostre os dados iterados no console.

Pré-requisitos

Antes de mergulhar no tutorial, certifique-se de ter os seguintes pré-requisitos instalados no seu sistema:

  • .NET 6.0 SDK: IronXL é construído em .NET, necessitando que o .NET 6.0 SDK esteja instalado no seu sistema.
  • Python 3.0+: O tutorial assume que você tenha Python 3.0 ou superior instalado.
  • pip: Certifique-se que o pip, o instalador de pacotes do Python, esteja instalado, pois será usado para instalar o IronXL.

Preparando seu ambiente

1. Criando um Arquivo no Visual Studio Code

Abra o Visual Studio Code e crie um novo arquivo Python chamado ReadExcel.py. Este arquivo conterá nosso script para ler arquivos Excel usando o IronXL.

Como Ler Arquivos Excel em Python: Figura 1

2. Instalando IronXL

Abra a linha de comando no Visual Studio Code selecionando Terminal > New Terminal do menu.

Como Ler Arquivos Excel em Python: Figura 2

Instale o IronXL executando o seguinte comando:

pip install ironxl
pip install ironxl
SHELL

Como Ler Arquivos Excel em Python: Figura 3

Escrevendo o Código

Agora, vamos dividir o código em seções e explicar cada parte.

Importando Bibliotecas

from ironxl import *
import sys
from ironxl import *
import sys
PYTHON

Aqui, importamos tudo da biblioteca ironxl, que fornece a funcionalidade para trabalhar com arquivos Excel. sys é usado para definir o caminho onde o Python está instalado, o que é necessário para que o IronXL funcione corretamente.

Definindo o Caminho de Instalação do Python

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
PYTHON

sys.prefix é atribuído ao caminho do diretório de instalação do seu Python. Esta etapa preparatória pode não ser necessária em todos os ambientes, mas é essencial em algumas configurações para evitar problemas relacionados ao caminho.

Configuração da Chave de Licença

License.LicenseKey = "License-Key"
License.LicenseKey = "License-Key"
PYTHON

A biblioteca IronXL requer uma chave de licença válida para desbloquear todas as suas funcionalidades. Esta linha de código License.LicenseKey = "License-Key" é onde você inserirá a chave de licença obtida. Sem uma licença válida, o IronXL não funcionará.

Carregando a Pasta de Trabalho

workbook = WorkBook.Load("data.xlsx")
workbook = WorkBook.Load("data.xlsx")
PYTHON

Esta seção do script, workbook = WorkBook.Load("data.xlsx"), demonstra como carregar uma pasta de trabalho do Excel. WorkBook.Load é um método fornecido pelo IronXL para abrir um arquivo Excel existente, especificado pelo seu caminho de arquivo.

O exemplo usa "data.xlsx", assumindo que este arquivo está localizado no mesmo diretório do script. Se o seu arquivo estiver em outro lugar, você precisará fornecer o caminho completo do arquivo.

Selecionando uma Planilha

worksheet = workbook.WorkSheets[0]
worksheet = workbook.WorkSheets[0]
PYTHON

Após carregar a pasta de trabalho, o próximo passo é selecionar uma planilha. A linha workbook.WorkSheets[0] acessa a primeira planilha no arquivo Excel. As planilhas são indexadas começando de 0, então este trecho de código seleciona efetivamente a primeira planilha.

Lendo e Exibindo Dados

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

Esta parte do script exemplifica como ler e exibir dados de células específicas. Ao iterar sobre um intervalo de células para as células na planilha["A2:A5"], acessamos o endereço de cada célula e o valor de texto. Você pode recuperar informações de áreas pré-definidas dentro de uma planilha.

Realizando Cálculos

O IronXL fornece funções para realizar cálculos simples diretamente em intervalos de dados dentro de uma planilha Excel. As seções seguintes do código demonstram como realizar cálculos simples como soma, mínimo e máximo em dados dentro de um intervalo especificado.

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON

Encontrando Valores Únicos

Esta parte do script demonstra como identificar valores únicos dentro de um intervalo especificado de uma planilha Excel:

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON

Para conseguir isso, utiliza-se uma compreensão de conjunto. Conjuntos em Python são coleções que automaticamente eliminam entradas duplicadas, tornando-os perfeitos para encontrar valores únicos. A compreensão itera sobre cada célula no intervalo F2:F10, acessando o conteúdo de texto de cada célula usando cell.Text.

Ao colocar essa iteração dentro de um conjunto, garantimos que apenas os valores únicos sejam mantidos.

Contando Ocorrências de um Valor Específico

Finalmente, este trecho conta quantas vezes um valor específico ocorre em um determinado intervalo.

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

O objetivo aqui é quantificar a ocorrência de um valor específico, rotulado aqui como specific_value. O código emprega uma expressão geradora que itera sobre cada célula no intervalo G2:G10, comparando o conteúdo de texto da célula com specific_value.

A expressão cell.Text == specific_value avalia como True para cada célula contendo o valor alvo e False caso contrário. A função sum adiciona esses valores Booleanos, tratando True como 1 e False como 0, contando efetivamente o número de vezes que o valor específico ocorre.

Exemplo de código completo

Aqui está o código completo para uma melhor compreensão do código:

from ironxl import *
import sys

# Setting Python installation path
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'

# Setting the license key for IronXL
License.LicenseKey = "License-Key"

# Load the workbook
workbook = WorkBook.Load("data.xlsx")

# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]

# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))

# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)

# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)

# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
from ironxl import *
import sys

# Setting Python installation path
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'

# Setting the license key for IronXL
License.LicenseKey = "License-Key"

# Load the workbook
workbook = WorkBook.Load("data.xlsx")

# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]

# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))

# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)

# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)

# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

Saída

Após executar o arquivo Python ReadExcel.py, você verá o seguinte resultado exibido no seu console, que reflete os resultados das operações realizadas pelo script nos dados do Excel.

Como Ler Arquivos Excel em Python: Figura 4

Conclusão

Neste tutorial, exploramos como configurar um ambiente Python para usar o IronXL para ler arquivos Excel. Abordamos a instalação do software necessário, escrevendo o script para carregar uma pasta de trabalho do Excel, selecionar uma planilha, ler os dados, realizar operações básicas de análise de dados, e mais.

O IronXL fornece uma API poderosa para trabalhar com arquivos Excel em Python, permitindo tarefas de análise de dados, limpeza de dados e visualização sem precisar do Microsoft Excel.

Seja analisando dados de vendas, importando dados para relatórios ou criando visualizações a partir de dados Excel, o IronXL oferece uma solução robusta para gerenciar arquivos Excel em aplicações Python.

IronXL oferece uma avaliação gratuita para os usuários explorarem seus recursos, com licenças a partir de $799 para aqueles prontos para integrar completamente suas capacidades.

Perguntas frequentes

Como posso ler arquivos do Excel em Python sem usar o Microsoft Excel?

IronXL permite que você leia arquivos Excel em Python sem precisar do Microsoft Excel instalado no seu sistema. Você pode carregar pastas de trabalho usando WorkBook.Load("data.xlsx") e acessar planilhas e dados de células diretamente.

Que configuração é necessária para usar o IronXL para ler arquivos Excel em Python?

Para usar o IronXL, certifique-se de ter o SDK do .NET 6.0, o Python 3.0 ou superior e o pip instalados. Configure seu ambiente de programação no Visual Studio Code para começar a trabalhar com arquivos do Excel.

Como instalo o IronXL em Python?

Instale o IronXL executando o comando pip install ironxl no seu terminal. Isso instala a biblioteca, permitindo que você leia e manipule arquivos do Excel.

Posso realizar operações de análise de dados em arquivos do Excel usando o IronXL?

Sim, o IronXL suporta diversas operações de análise de dados, como calcular somas, encontrar valores mínimos e máximos e identificar valores únicos em planilhas do Excel.

Como posso encontrar valores únicos em um intervalo do Excel usando o IronXL?

Para encontrar valores únicos, utilize uma compreensão de conjunto para iterar sobre o intervalo de células e extrair valores de texto distintos. Esse método identifica com eficiência todas as entradas únicas.

É possível contar valores específicos no Excel usando o IronXL?

Sim, você pode contar as ocorrências de um valor específico iterando pelo intervalo de células com uma expressão geradora e somando as instâncias em que o texto da célula corresponde ao valor desejado.

Quais são os benefícios de usar o IronXL para manipulação do Excel em Python?

IronXL oferece uma API poderosa para manipulação de arquivos Excel sem a necessidade do Microsoft Excel. É ideal para tarefas como análise, limpeza e visualização de dados, aumentando a produtividade em projetos Python.

Como faço para escrever um script em Python para ler arquivos do Excel usando o IronXL?

Crie um script em Python chamado ReadExcel.py , importe as bibliotecas necessárias, configure o caminho do Python e use os métodos do IronXL para carregar e interagir com planilhas e dados do Excel.

Que operações posso realizar em dados do Excel usando o IronXL?

O IronXL permite diversas operações, como leitura de valores de células, seleção de planilhas, cálculo de somas, localização de valores mínimos/máximos e contagem de ocorrências específicas em intervalos de dados do Excel.

Curtis Chau
Redator Técnico

Curtis Chau é bacharel em Ciência da Computação (Universidade Carleton) e se especializa em desenvolvimento front-end, com experiência em Node.js, TypeScript, JavaScript e React. Apaixonado por criar interfaces de usuário intuitivas e esteticamente agradáveis, Curtis gosta de trabalhar com frameworks modernos e criar manuais ...

Leia mais

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me