PYTHONのためのIRONXLの使用

Pythonを使用してExcelスプレッドシートを読み取る方法

チャクニット・ビン
チャクニット・ビン
2024年6月6日
共有:

イントロダクション

効果的なデータ管理と処理は、データ主導の現代社会において、個人にとっても企業にとっても不可欠である。 エクセルのスプレッドシートは、その利便性と適応性の高さから、データの整理や保存に最も広く使われているファイル形式のひとつであり続けている。 Python プログラミング言語は、その堅牢なライブラリにより、Excelファイルを操作するための豊富なツールを提供します。

IronXL ライブラリはこれらのツールの1つであり、Excelファイルを簡単に読み書きする最も信頼できるオプションの1つです。 このチュートリアルでは、IronXLを使用して(Pythonで)Excelスプレッドシートファイルを読み取り、ユーザーがExcelファイルを読み取ってデータ管理のためのワークフローを最適化する方法の詳細について説明します。

Pythonを使ってExcelスプレッドシートを読む方法

  1. Visual Studio Codeを開き、Pythonファイルを作成します。

  2. Python用IronXLライブラリをインストールするにはpipを使用します。

  3. 読み込む必要のあるExcel文書を開く。

  4. ループを使ったExcelデータの反復処理

  5. コンソールに再発データを表示

IronXL

IronXL は、Excel ファイルで使用するために特別に作成された機能豊富な Python ライブラリです。 プログラマーには、表計算データの読み取り、編集、修正のための多数のオプションが提供される。 IronXLは.NETフレームワークの上に構築されており、.NETのパフォーマンスとPython の柔軟性を融合させることで、Excelファイルを効果的に操作する方法を提供します。

IronXLは、現在のExcelファイルから簡単にデータを読み込むことができるのが大きな特徴です。 開発者は、オブジェクトセル、行、列名のリスト、数値列、列などの特定のファイルから簡単にデータを抽出したり、Excelスプレッドシート内の欠損値を処理したりすることができ、ExcelデータをPythonプログラムにシームレスに統合することができます。 IronXLは、財務、顧客、販売データの検索など、Excelデータに効率的にアクセスし、操作するために必要なリソースを提供します。

IronXLの機能

IronXL は既存のExcelファイルからデータをシームレスに読み込んだり、新しく作成したスプレッドシートや既存のスプレッドシートにデータを書き込んだりすることができます。 数式、書式設定、セル値へのアクセスなど、さまざまなトピックを扱います。

主な機能例

  • クロスプラットフォーム互換性: IronXLは、Windows、Linux、macOSを含むさまざまなプラットフォームで完璧に機能するように設計されているため、どのオペレーティングシステムでもPython開発者に適した柔軟な選択肢です。
  • 効率的な効率性: IronXLは、.NETフレームワークの上に構築されており、Pythonの柔軟性と.NETの効率性を組み合わせて、膨大なデータセットを扱う場合でもExcelファイルを効率的に処理および操作します。
  • Excel フォーマットのサポート: IronXL は幅広い Excel ファイルに対応し、以下の Excel フォーマットをサポートしています: .xls (Excel 97-2003)、.xlsm (マクロが有効な Excel)、および .xlsx ファイルフォーマット (Excel 2007 以降)。
  • 高度なデータ操作: IronXLは、ユーザーがExcelスプレッドシート内のデータをより洗練された方法で操作し、並べ替え、フィルタリング、集計といった操作を通じてデータから洞察に満ちた情報を抽出できるようにします。
  • セルのフォーマット: IronXL のセルフォーマット機能を使用することで、フォントスタイル、色、境界線、および配置を含め、Excel スプレッドシートをより美しく読みやすくすることができます。
  • 数式計算: IronXL は、ユーザーが Excel の数式を扱うために使用でき、数式の評価、参照の更新、および Excel スプレッドシート内での動的計算が含まれます。
  • Python環境との統合: IronXLはPython環境に簡単に組み込むことができ、他のPythonフレームワークやパッケージとその機能を組み合わせて、詳細なデータビジュアライゼーションと分析を可能にします。
  • 使いやすさ: 経験の浅い開発者もベテランのPython開発者も、IronXLのユーザーフレンドリーでシンプルなAPIを活用できます。 よく文書化されたインターフェイスは、その機能を最大限に活用する方法について的確な指示を提供します。

    まとめると、IronXLはPythonアプリにExcel機能を組み込むための安定したユーザーフレンドリーな方法を提供し、Python開発者がExcelファイルを扱う際の困難を克服することを可能にします。 インタラクティブなダッシュボードの開発、Excelファイルを読み込むレポート作成の自動化、Excelファイルを読み込むデータ分析ツールの開発など、IronXLはPythonエコシステムの中でExcelファイルを操作するために必要な柔軟性とリソースを提供します。

    IronXLライブラリとそのすべての機能について詳しく知るには、こちらをチェックしてください。

セットアップ環境

前提条件

チュートリアルを始める前に、以下のものがPCにインストールされていることを確認してください:

  • IronXLは.NET 6.0 SDKで設計されているため、マシンに.NET 6.0 SDKがインストールされている必要があります。
  • Python 3.0+: このレッスンでは、Python 3.0またはそれ以降のバージョンがインストールされていることを前提としています。
  • pipPython用パッケージインストーラであるpipを最初にインストールしてください。

IronXLをインストール

このファイルをVisual Studio Codeで開き、ReadSpreadsheet.pyというPythonファイルを作成する。 このファイルにはIronXLでExcelファイルを読み込むためのスクリプトが含まれています。

Pythonを使用してExcelスプレッドシートを読み取る方法: 図1 - 新しいPythonファイルの作成

Visual Studio Codeでコマンドラインにアクセスするには、メニューから「ターミナル」 > 「新規ターミナル」をクリックします。

Pythonを使用してExcelスプレッドシートを読み込む方法: 図2 - ターミナルの場所

IronXLを利用する前に、ライブラリをインストールすることが最初のステップです。 Pythonのパッケージマネージャpipを使用して、次のコマンドを実行することでIronXLを素早くインストールすることができます:

pip install IronXL

IronXLがインストールされたので、Excelスプレッドシートファイルの読み込み機能を使用することができます。

Pythonを使用してExcelスプレッドシートを読む方法: 図3 - ターミナルでのインストール出力

Excelスプレッドシートの読み込み

IronXLは、Excelスプレッドシートでデータ分析を簡単に読むことができます。 まず、既存のExcelシート・ファイル・フォーマットからデータ型をPython環境にインポートしてみよう:

from ironxl import *     # Load the Excel file
workbook = WorkBook.Load("Demo.xlsx")
# select zero indexed sheet positions
worksheet = workbook.DefaultWorkSheet
# Access cell values
cell_value = worksheet["A1"].StringValue
# Access row values
row_values = worksheet.Rows[1].StringValue
# parsing string columns
column_values = worksheet.Columns[0].StringValue
for row in worksheet.Rows:
    print(row.StringValue)
PYTHON

IronXLからWorkBookクラスをインポートした後、Excelファイルの場所を使用してWorkBookクラスをインスタンス化します。 そうすることで、エクセル・シートに使用できるワークブック・オブジェクトを生成し、スプレッドシートの内容を取得することができる。 いったんワークブック・オブジェクトにロードすれば、オブジェクトに格納されたセルの値、行、列を含むExcelスプレッドシートのデータにアクセスできる。 IronXL Excelワークブックはさらに、複数のExcelシートからデータを作成・取得する簡単な方法を提供します。

単一のセル(A1)の値を取得することができ、特定の行の値、列のラベル、列名のリストのような表形式のデータも取得できます。 データを扱うには、エクセルのスプレッドシートの行や列をループすることがよくある。 IronXLは、その便利な反復テクニックでこのプロセスを簡単にします。 各行、列インデックス、セルを繰り返し処理することで、エクセル・シートに含まれるデータを簡単に処理し、操作することができる。

Pythonを使用してExcelスプレッドシートを読み取る方法: 図4 - 入力Excelシート

上記のExcelを読み込むと、IronXLから以下のような出力が得られます。

Pythonを使用してExcelスプレッドシートを読み取る方法: 図5 - 前のコードからのコンソール出力

IronXLのコードについて学ぶには、こちらを参照してください。

結論

最後に、IronXL Pythonは、PythonとExcelファイルの橋渡しをすることで、Excelファイルを処理する際の困難を克服します。 IronXL は、PythonプログラムにExcelファイルを使用する機能を組み込むための、安定したユーザーフレンドリーな方法を提供する機能豊富なツールです。 データの読み取りと書き込み、セルの書式設定、データの視覚化、数式の操作、複数のプラットフォームとの互換性が可能です。 IronXL Pythonは、ソフトウェア開発者、データサイエンティスト、ビジネスアナリストなどのバックグラウンドに関係なく、Pythonエコシステム内でExcelファイル操作を成功させるために必要な柔軟性とツールを提供します。

ソフトウェア開発者、ビジネスアナリスト、データマイニング担当者、データサイエンティストなど、どのような立場の方でも、IronXL を使用することで、スプレッドシートを読みこなすエキスパートとなり、生産的なデータ操作の可能性を広げることができます。 IronXLを使ってExcelを読み、データ管理の領域を探求し、Python の知識を増やしましょう。

IronXLの$749 Lite エディションには、1年間のソフトウェアサポート、アップグレードオプション、および永久ライセンスが含まれています。 お客様は、試用期間中に実際の環境で製品を評価する機会があります。ライセンスのページをご覧ください。 また、Iron Softwareについて詳しくは、こちらのページをご覧ください。

チャクニット・ビン
ソフトウェアエンジニア
ChaknithはIronXLとIronBarcodeで作業しています。彼はC#と.NETに深い専門知識を持ち、ソフトウェアの改善と顧客サポートを支援しています。ユーザーとの対話から得た彼の洞察は、より良い製品、文書、および全体的な体験に貢献しています。
< 以前
PythonでExcelファイルからワークシートを削除する方法
次へ >
Pythonを使用してExcelファイルにエクスポートする方法