透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
Excelファイルを扱うことは、データ分析や自動化作業において一般的な要件である。 Pythonは、豊富なライブラリセットを活用して、XLSXファイルとやり取りする様々な方法を提供します。 このチュートリアルでは、Python用のExcelライブラリであるIronXLを使用してExcelファイルを読み取る方法を学びます。
IronXL Python は、開発者がPythonでExcelファイルを簡単に読み書きできるように設計されています。 エクセルファイルの書き込みだけでなく、複数のエクセルシートを一度に扱うこともできる。 このライブラリは、マイクロソフト・エクセルをマシンにインストールすることなく、エクセルファイルを書き込むのに最適です。
データをExcelスプレッドシートに直接インポートする必要がある場合、IronXLがお役に立ちます。 IronXLはExcelスプレッドシートの取り扱いを簡単にします。 XLSXファイルの複数のシートにまたがるデータを簡単に管理できます。
IronXL を使用して Python で Excel ファイルを読み取る方法を見てみましょう。
PythonでExcelファイルを読み込む手順を説明します。
Visual StudioのコードでPythonファイルを作成します。
pip を使って Python Excel ライブラリをインストールします。
読み込む必要のあるエクセルファイルを読み込む
ループを使ってExcelデータを反復処理する
チュートリアルに入る前に、以下の前提条件がシステムにインストールされていることを確認してください:
Visual Studio Codeを開き、新しいPythonファイルReadExcel.pyを作成します。 このファイルにはIronXLを使ってExcelファイルを読み込むスクリプトが含まれます。
メニューからTerminal > New Terminal`を選択して、Visual Studio Codeのコマンドラインを開きます。
以下のコマンドを実行してIronXLをインストールします:
pip install IronXL
では、コードをセクションに分け、それぞれの部分を説明しよう。
from ironxl import * import sys
ここでは、Excelファイルを操作する機能を提供するironxlライブラリからすべてをインポートします。 sys は Python がインストールされているパスを設定するために使用され、IronXL が正しく機能するために必要です。
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix は、Pythonインストールディレクトリへのパスを割り当てられます。 これは、すべての環境において必要ではないかもしれないが、パス関連の問題を防ぐために構成によっては不可欠な準備ステップである。
License.LicenseKey = "License-Key";
IronXLライブラリは、すべての機能をアンロックするために有効なライセンスキーが必要です。 このコードの行License.LicenseKey = "License-Key"; は、取得したライセンスキーを挿入する場所です。 有効なライセンスがない場合、IronXLは動作しません。
workbook = WorkBook.Load("data.xlsx")
このスクリプトのセクション、workbook = WorkBook.Load("data.xlsx")は、Excelワークブックの読み込み方法を示しています。 WorkBook.Load は、IronXL が提供するメソッドで、指定されたファイルパスによって既存のExcelファイルを開く方法です。
この例では、"data.xlsx"を使用し、このファイルがスクリプトと同じディレクトリにあることを前提としています。 ファイルが他の場所にある場合は、完全なファイルパスを指定する必要があります。
worksheet = workbook.WorkSheets[0]
ワークブックをロードしたら、次はワークシートを選択する。 workbook.WorkSheets[0]行は、Excelファイルの最初のワークシートにアクセスします。ワークシートは0からインデックス付けされているため、このコードスニペットは実質的に最初のシートを選択します。
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
スクリプトのこの部分では、特定のセルからデータを読み込んで表示する方法を例示する。 ワークシート["A2:A5"]内のセル範囲のセルを反復処理することで、各セルのアドレスとテキスト値にアクセスできます。 シート内の定義済みの領域から情報を取得できます。
IronXLはExcelシート内のデータ範囲に直接簡単な計算を実行する関数を提供します。 コードの以下のセクションは、指定された範囲内のデータに対して、合計、最小、最大といった単純な計算を実行する方法を示している。
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
スクリプトのこの部分では、Excelシートの指定された範囲内で一意な値を識別する方法を示します:
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
これを実現するために、セット理解力が活用される。 Python におけるセットは、重複エントリを自動的に排除するコレクションであり、ユニークな値を見つけるのに最適です。 理解は範囲F2:F10の各セルを反復し、cell.Textを使用して各セルのテキストコンテンツにアクセスします。
この反復をセット内に置くことで、一意な値だけが保持されるようにする。
最後に、このスニペットは、与えられた範囲内で特定の値が何回現れるかをカウントする。
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
ここでの目標は、specific_valueとしてラベル付けされた特定の値の発生を定量化することです。 コードはジェネレーター式を使用して、G2:G10 の範囲内の各セルを反復処理し、セルのテキスト内容をspecific_valueと比較します。
cell.Text == specific_valueという式は、ターゲット値を含む各セルに対してTrueとなり、それ以外の場合はFalseとなります。sum関数は、これらのブール値を合計し、Trueを1として、Falseを0として扱うことで、特定の値が出現する回数を実質的にカウントします。
以下は、コードの理解を深めるための完全なコードである:
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PythonファイルReadExcel.pyを実行した後、コンソールに次の出力が表示され、スクリプトがExcelデータに対して行った操作の結果が反映されます。
このチュートリアルでは、IronXL for Pythonを使ってExcelファイルを読み込むためのPython環境のセットアップ方法について説明しました。 必要なソフトウェアのインストール、エクセルのワークブックを読み込むスクリプトの作成、ワークシートの選択、データの読み込み、基本的なデータ分析操作などについて説明した。
IronXLはPythonでExcelファイルを操作するための強力なAPIを提供し、Microsoft Excelを必要とせずにデータ分析、データクリーニング、可視化タスクを可能にします。
売上データの分析、レポートのためのデータのインポート、Excelデータからのビジュアライゼーションの作成など、IronXL はPythonアプリケーションでExcelファイルを管理するための堅牢なソリューションを提供します。
IronXLは、その機能を探索するための無料試用版を提供し、完全に統合する準備ができたユーザー向けにはライセンスが$749から始まります。