PYTHONのためのIRONXLの使用

PythonでExcelファイルを読み取る方法

公開済み 2024年6月6日
共有:

Excelファイルを扱うことは、データ分析や自動化作業において一般的な要件である。 Pythonは、その豊富なライブラリXLSXファイルを操作する様々な方法を提供します。 このチュートリアルでは、エクセルファイルの読み込み方法としてIronXLPython Excelライブラリ。

IronXL:Python Excelライブラリ

IronXL Python は、開発者がPythonでExcelファイルを簡単に読み書きできるように設計されています。 エクセルファイルの書き込みだけでなく、複数のエクセルシートを一度に扱うこともできる。 このライブラリは、マイクロソフト・エクセルをマシンにインストールすることなく、エクセルファイルを書き込むのに最適です。

データをExcelスプレッドシートに直接インポートする必要がある場合、IronXLがお役に立ちます。 IronXLはExcelスプレッドシートの取り扱いを簡単にします。 XLSXファイルの複数のシートにまたがるデータを簡単に管理できます。

どうすればいいか考えてみようPythonでExcelファイルを読む IronXL を使用しています。

PythonでExcelファイルを読み取る方法

PythonでExcelファイルを読み込む手順を説明します。

  1. Visual StudioのコードでPythonファイルを作成します。

  2. pip を使って Python Excel ライブラリをインストールします。

  3. 読み込む必要のあるエクセルファイルを読み込む

  4. ループを使ってExcelデータを反復処理する

  5. 繰り返しデータをコンソールに表示する

前提条件

チュートリアルに入る前に、以下の前提条件がシステムにインストールされていることを確認してください:

  • .NET 6.0 SDK:IronXL for .NETは.NET上に構築されているため、.NET 6.0 SDKがシステムにインストールされている必要があります。
  • Python 3.0+:このチュートリアルでは、Python 3.0以上がインストールされていることを前提としています。
  • pip:Python用パッケージインストーラであるpipがインストールされていることを確認してください。Python のインストールに使用されます。

環境の設定

1. Visual Studio Codeでファイルを作成する

Visual Studio Code を開き、ReadExcel.py という新しい Python ファイルを作成します。 このファイルにはIronXLを使ってExcelファイルを読み込むスクリプトが含まれます。

PythonでExcelファイルを読む方法:図1

2. IronXLのインストール

メニューからTerminal > New Terminal`を選択して、Visual Studio Codeのコマンドラインを開きます。

PythonでExcelファイルを読む方法:図2

以下のコマンドを実行してIronXLをインストールします:

pip install IronXL

PythonでExcelファイルを読む方法:図3

コードを書く

では、コードをセクションに分け、それぞれの部分を説明しよう。

ライブラリのインポート

from ironxl import *     import sys
PYTHON

ここでは、Excelファイルを扱う機能を提供するironxlライブラリからすべてをインポートします。 sysはPython が正しく機能するために必要なPythonがインストールされているパスを設定するために使用されます。

Pythonインストールパスの設定

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
PYTHON

sys.prefixには、Pythonのインストールディレクトリへのパスが割り当てられます。 これは、すべての環境において必要ではないかもしれないが、パス関連の問題を防ぐために構成によっては不可欠な準備ステップである。

ライセンスキーの設定

License.LicenseKey = "License-Key";
PYTHON

IronXL ライブラリには有効なライセンスキーすべての機能をアンロックする。 この行は、License.LicenseKey = "License-Key";取得したライセンス・キーを挿入する場所です。 有効なライセンスがない場合、IronXLは動作しません。

ワークブックの読み込み

workbook = WorkBook.Load("data.xlsx")
PYTHON

スクリプトのこのセクション、workbook = WorkBook.Load("data.xlsx")エクセルのワークブックをロードする方法を示します。 WorkBook.LoadはIronXLが提供するメソッドで、ファイルパスで指定された既存のExcelファイルを開きます。

この例では、"data.xlsx "を使用しており、このファイルはスクリプトと同じディレクトリにあると仮定している。 ファイルが他の場所にある場合は、完全なファイルパスを指定する必要があります。

ワークシートの選択

worksheet = workbook.WorkSheets[0]
PYTHON

ワークブックをロードしたら、次はワークシートを選択する。 ワークブック.ワークシート[0]** 行はエクセルファイルの最初のワークシートにアクセスします。ワークシートのインデックスは0から始まるので、このコード・スニペットは事実上最初のシートを選択します。

データの読み取りと表示

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

スクリプトのこの部分では、特定のセルからデータを読み込んで表示する方法を例示する。 ワークシートのセルに対して、セル範囲を繰り返し処理する。[「A2:A5]**各セルのアドレスとテキスト値にアクセスできる。 シート内の定義済みの領域から情報を取得できます。

計算の実行

IronXLはExcelシート内のデータ範囲に直接簡単な計算を実行する関数を提供します。 コードの以下のセクションは、指定された範囲内のデータに対して、合計、最小、最大といった単純な計算を実行する方法を示している。

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON

独自の価値を見つける

スクリプトのこの部分では、Excelシートの指定された範囲内で一意な値を識別する方法を示します:

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON

これを実現するために、セット理解力が活用される。 Python におけるセットは、重複エントリを自動的に排除するコレクションであり、ユニークな値を見つけるのに最適です。 この内包は、範囲F2:F10の各セルを繰り返し処理し、cell.Textを使用して各セルのテキスト内容にアクセスします。

この反復をセット内に置くことで、一意な値だけが保持されるようにする。

特定の値の出現回数を数える

最後に、このスニペットは、与えられた範囲内で特定の値が何回現れるかをカウントする。

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

ここでは、specific_valueとラベル付けされた特定の値の発生を定量化することが目的である。 このコードは、範囲G2:G10の各セルを繰り返し、セルのテキスト内容とspecific_valueを比較するジェネレーター式を採用している。

cell.Text == specific_valueは、対象値を含む各セルに対してTrue、そうでなければFalseと評価される。sum関数はこれらのブール値を加算し、Trueを1、False**を0として扱い、特定の値が出現した回数を効果的にカウントします。

コード例

以下は、コードの理解を深めるための完全なコードである:

from ironxl import *     import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

出力

Python ファイル ReadExcel.py を実行すると、コンソールに以下のような出力が表示されます。

PythonでExcelファイルを読む方法:図4

結論

このチュートリアルでは、IronXL for Pythonを使ってExcelファイルを読み込むためのPython環境のセットアップ方法について説明しました。 必要なソフトウェアのインストール、エクセルのワークブックを読み込むスクリプトの作成、ワークシートの選択、データの読み込み、基本的なデータ分析操作などについて説明した。

IronXLはPythonでExcelファイルを操作するための強力なAPIを提供し、Microsoft Excelを必要とせずにデータ分析、データクリーニング、可視化タスクを可能にします。

売上データの分析、レポートのためのデータのインポート、Excelデータからのビジュアライゼーションの作成など、IronXL はPythonアプリケーションでExcelファイルを管理するための堅牢なソリューションを提供します。

IronXLは、無料試用ライセンスは $749 からあり、その機能を完全に統合する準備ができているユーザー向けです。

< 以前
インタープロ依存無しのExcelファイル用Pythonパッケージ
次へ >
PythonでExcelファイルを表示する方法

準備はできましたか? バージョン: 2024.11 新発売

無料のpipダウンロード ライセンスを表示 >