PYTHONのためのIRONXLの使用

PythonでExcelファイルを読み取る方法

チャクニット・ビン

2024年6月6日

共有:

Excelファイルを扱うことは、データ分析や自動化作業において一般的な要件である。 Pythonは、豊富なライブラリセットを活用して、XLSXファイルとやり取りする様々な方法を提供します。このチュートリアルでは、Python用のExcelライブラリであるIronXLを使用してExcelファイルを読み取る方法を学びます。

IronXL：Python Excelライブラリ

IronXL Python は、開発者がPythonでExcelファイルを簡単に読み書きできるように設計されています。エクセルファイルの書き込みだけでなく、複数のエクセルシートを一度に扱うこともできる。このライブラリは、マイクロソフト・エクセルをマシンにインストールすることなく、エクセルファイルを書き込むのに最適です。

データをExcelスプレッドシートに直接インポートする必要がある場合、IronXLがお役に立ちます。 IronXLはExcelスプレッドシートの取り扱いを簡単にします。 XLSXファイルの複数のシートにまたがるデータを簡単に管理できます。

IronXL を使用して Python で Excel ファイルを読み取る方法を見てみましょう。

PythonでExcelファイルを読み取る方法

PythonでExcelファイルを読み込む手順を説明します。

Visual StudioのコードでPythonファイルを作成します。
pip を使って Python Excel ライブラリをインストールします。
読み込む必要のあるエクセルファイルを読み込む
ループを使ってExcelデータを反復処理する
繰り返しデータをコンソールに表示する

前提条件

チュートリアルに入る前に、以下の前提条件がシステムにインストールされていることを確認してください：

.NET 6.0 SDK: IronXLは.NETに基づいて構築されており、システムに.NET 6.0 SDKをインストールする必要があります。
Python 3.0+: このチュートリアルは、Python 3.0以上がインストールされていることを前提としています。
pip: IronXLをインストールするために使用するので、Pythonのパッケージインストーラーであるpipがインストールされていることを確認してください。

環境の設定

1. Visual Studio Codeでファイルを作成する

Visual Studio Codeを開き、新しいPythonファイルReadExcel.pyを作成します。このファイルにはIronXLを使ってExcelファイルを読み込むスクリプトが含まれます。

PythonでExcelファイルを読み取る方法: 図1

2. IronXLのインストール

メニューからTerminal > New Terminal`を選択して、Visual Studio Codeのコマンドラインを開きます。

PythonでExcelファイルを読む方法: 図2

以下のコマンドを実行してIronXLをインストールします:

pip install IronXL

PythonでExcelファイルを読み取る方法: 図3

コードを書く

では、コードをセクションに分け、それぞれの部分を説明しよう。

ライブラリのインポート

from ironxl import *     import sys

python

PYTHON

ここでは、Excelファイルを操作する機能を提供するironxlライブラリからすべてをインポートします。 sys は Python がインストールされているパスを設定するために使用され、IronXL が正しく機能するために必要です。

Pythonインストールパスの設定

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'

python

PYTHON

sys.prefix は、Pythonインストールディレクトリへのパスを割り当てられます。これは、すべての環境において必要ではないかもしれないが、パス関連の問題を防ぐために構成によっては不可欠な準備ステップである。

ライセンスキーの設定

License.LicenseKey = "License-Key";

python

PYTHON

IronXLライブラリは、すべての機能をアンロックするために有効なライセンスキーが必要です。このコードの行License.LicenseKey = "License-Key"; は、取得したライセンスキーを挿入する場所です。有効なライセンスがない場合、IronXLは動作しません。

ワークブックの読み込み

workbook = WorkBook.Load("data.xlsx")

python

PYTHON

このスクリプトのセクション、workbook = WorkBook.Load("data.xlsx")は、Excelワークブックの読み込み方法を示しています。 WorkBook.Load は、IronXL が提供するメソッドで、指定されたファイルパスによって既存のExcelファイルを開く方法です。

この例では、"data.xlsx"を使用し、このファイルがスクリプトと同じディレクトリにあることを前提としています。ファイルが他の場所にある場合は、完全なファイルパスを指定する必要があります。

ワークシートの選択

worksheet = workbook.WorkSheets[0]

python

PYTHON

ワークブックをロードしたら、次はワークシートを選択する。 workbook.WorkSheets[0]行は、Excelファイルの最初のワークシートにアクセスします。ワークシートは0からインデックス付けされているため、このコードスニペットは実質的に最初のシートを選択します。

データの読み取りと表示

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))

python

PYTHON

スクリプトのこの部分では、特定のセルからデータを読み込んで表示する方法を例示する。ワークシート["A2:A5"]内のセル範囲のセルを反復処理することで、各セルのアドレスとテキスト値にアクセスできます。シート内の定義済みの領域から情報を取得できます。

計算の実行

IronXLはExcelシート内のデータ範囲に直接簡単な計算を実行する関数を提供します。コードの以下のセクションは、指定された範囲内のデータに対して、合計、最小、最大といった単純な計算を実行する方法を示している。

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)

python

PYTHON

独自の価値を見つける

スクリプトのこの部分では、Excelシートの指定された範囲内で一意な値を識別する方法を示します：

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)

python

PYTHON

これを実現するために、セット理解力が活用される。 Python におけるセットは、重複エントリを自動的に排除するコレクションであり、ユニークな値を見つけるのに最適です。理解は範囲F2:F10の各セルを反復し、cell.Textを使用して各セルのテキストコンテンツにアクセスします。

この反復をセット内に置くことで、一意な値だけが保持されるようにする。

特定の値の出現回数を数える

最後に、このスニペットは、与えられた範囲内で特定の値が何回現れるかをカウントする。

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)

python

PYTHON

ここでの目標は、specific_valueとしてラベル付けされた特定の値の発生を定量化することです。コードはジェネレーター式を使用して、G2:G10 の範囲内の各セルを反復処理し、セルのテキスト内容をspecific_valueと比較します。

cell.Text == specific_valueという式は、ターゲット値を含む各セルに対してTrueとなり、それ以外の場合はFalseとなります。sum関数は、これらのブール値を合計し、Trueを1として、Falseを0として扱うことで、特定の値が出現する回数を実質的にカウントします。

コード例

以下は、コードの理解を深めるための完全なコードである：

from ironxl import *     import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)

python

PYTHON

出力

PythonファイルReadExcel.pyを実行した後、コンソールに次の出力が表示され、スクリプトがExcelデータに対して行った操作の結果が反映されます。

PythonでExcelファイルを読む方法: 図4

結論

このチュートリアルでは、IronXL for Pythonを使ってExcelファイルを読み込むためのPython環境のセットアップ方法について説明しました。必要なソフトウェアのインストール、エクセルのワークブックを読み込むスクリプトの作成、ワークシートの選択、データの読み込み、基本的なデータ分析操作などについて説明した。

IronXLはPythonでExcelファイルを操作するための強力なAPIを提供し、Microsoft Excelを必要とせずにデータ分析、データクリーニング、可視化タスクを可能にします。

売上データの分析、レポートのためのデータのインポート、Excelデータからのビジュアライゼーションの作成など、IronXL はPythonアプリケーションでExcelファイルを管理するための堅牢なソリューションを提供します。

IronXLは、その機能を探索するための無料試用版を提供し、完全に統合する準備ができたユーザー向けにはライセンスが$749から始まります。

チャクニット・ビン

今すぐエンジニアリングチームとチャット

ソフトウェアエンジニア

ChaknithはIronXLとIronBarcodeで作業しています。彼はC#と.NETに深い専門知識を持ち、ソフトウェアの改善と顧客サポートを支援しています。ユーザーとの対話から得た彼の洞察は、より良い製品、文書、および全体的な体験に貢献しています。

< 以前
インタープロ依存無しのExcelファイル用Pythonパッケージ

次へ >
PythonでExcelファイルを表示する方法