PYTHONのためのIRONXLの使用

Visual Studio Code を使用して Python で Excel ファイルを読み込む方法

チャクニット・ビン
チャクニット・ビン
2024年4月3日
共有:

イントロダクション

Excel ファイルは、データの保存と操作によく使用されます。 Excelシートの使用において一般的なタスクには、販売データの保存や販売予測の計算の自動化が含まれます。しかし、このデータをPythonスクリプトに取り込む際に手動で操作することは、労力がかかり、エラーが発生しやすいです。大規模なデータセットを扱う際にPythonと共に頻繁に使用される一般的なライブラリのひとつに、pandasライブラリがあります。 ただし、ユーザーは他の依存関係と一緒にpandasをインポートする必要があるため、スケーラビリティの点で理想的ではありません。 さらに、Pandas の学習曲線は急であり、その API は初心者にとって圧倒されることがよくあります。そのため、Excel ファイルの操作を容易にする堅牢な Python モジュールである IronXL が登場します。

この投稿では、Visual Studio Codeを使用してPythonでExcelファイルを読み取る方法を教えます。 効果的なデータ処理のための高度な方法について議論し、インストール手順を確認し、さまざまなデータ構造を読み取るための主要なコード例を検討します。

Visual Studio Code を使用して Python で Excel ファイルを読み込む方法

  1. Visual Studio Codeを使用してPythonの新しいプロジェクト/環境を作成する。

  2. IronXLライブラリをPythonにインストールします。

  3. Pythonコードにライブラリをインポートします。

  4. 読み込む Excel ファイルをインポートします。

  5. ワークシートを選択して、範囲またはセルアドレスを使用して値を取得します。

  6. 値を処理し、結果を表示します。

IronXL

IronXL は、Python プロジェクトでの Excel ファイル (.xls、.xlsx、.xlsm) の操作を簡単にするために特別に作られた強力な Python パッケージです。 それは、さまざまな操作のための使いやすいAPIを提供し、あなたのPythonコードとExcelスプレッドシートの世界との橋渡し役を果たします。

IronXLの機能

  • データの処理: IronXLは、Excelスプレッドシートでのデータの読み取り、書き込み、および操作を容易にします。 計算、数式、およびデータのフォーマットがすべて可能であり、セルの値は2次元配列を使用して取得できます。
  • Excel ファイルの作成と変更: 開発者は新しいExcelファイルを作成したり、既存のファイルを編集したり、ワークシートを追加、削除、管理することができます。 また、他のExcelコンポーネントとインターフェースするためにDLLファイルを使用することもできます。
  • . .NET 統合と互換性: IronXL は、Xamarin、.NET Core、.NET Framework などのさまざまな .NET プラットフォームと統合することができ、そのクロスプラットフォーム互換性により、さまざまなアプリケーションシナリオでの使用に適しています。
  • ユーザーフレンドリーなAPI: このライブラリは、明確で適切に文書化されたAPIのおかげで、すべてのスキルレベルの開発者にとって使いやすいです。 ファイルと効率的にやり取りするためには、Excelの構造の専門家である必要はありません。
  • 依存関係なし: IronXLは、他の一部のソリューションとは異なり、作業しているコンピューターにMicrosoft Officeをインストールする必要がありません。 それは自律的に動作し、互換性の問題を取り除き、多くの環境での展開を容易にします。
  • 豊富な機能セット: IronXLはデータの読み取りだけに限定されていません; それは幅広い機能を提供します。 Pythonコードを使用して、Excelファイルのセルをフォーマットし、数式を管理し、チャートを生成することができます。 これにより、スプレッドシートを物理的に変更することなく、さまざまなアクティビティを実行することができます。
  • データ抽出とエクスポート: IronXLは、Excelファイルからのデータ抽出やExcelデータをXML、新しいデータテーブル、プレーンテキストなどの形式にエクスポートすることを容易にすることで、データベースや他のシステムとの接続を簡単にします。
  • 多様性と互換性: これは、いくつかのExcelバージョンに対応しており、従来のXLS Excelフォーマットに加えて、新しいXLSX ExcelフォーマットとCSVファイルフォーマットをサポートします。

    データ操作とExcel統合により、プログラマーはExcelファイルを扱い、信頼性の高いソリューションを提供することが可能になります。 使用方法についての詳細は、こちらのドキュメントをご参照ください。

新しいプロジェクトフォルダーの作成

Visual Studio Code を起動します。

Visual Studio Codeを使用してPythonでExcelファイルを読む方法: 図1 - Visual Studio Codeの空のプロジェクトディレクトリ

ファイル > フォルダーを開く に移動します (または Windows/Linux の場合は Ctrl+K Ctrl+O、macOS の場合は Cmd+K Cmd+O のキーボードショートカットを押します)。

Visual Studio Codeを使用してPythonでExcelファイルを読み込む方法: 図2 - ファイルをクリックし、Visual Studio Codeで新しいプロジェクトフォルダを作成するためにフォルダを選択

新しく作成したプロジェクトフォルダーを保存する場所をPCで選択してください。 プロジェクトフォルダーを作成するには、「フォルダーを選択」をクリックしてください。

VS CodeでPythonファイルを作成する

新しく作成されたプロジェクトフォルダに新しいPythonファイルを作成し、そのファイルにPythonコードを含めることができます。

これを行うには2つの方法があります。

  • プロジェクトフォルダ内の任意の場所を右クリックし、「新しいファイル」を選択します。ファイル名に .py 拡張子を付けて Python ファイル(例: my_script.py)を命名します。
  • 「ファイル」>「新規ファイル」に移動します(Windows/LinuxではCtrl+N、macOSではCmd+Nを使用して新しいファイルを開きます)。 Pythonファイル名に .py 拡張子を付けた後、Enterキーを押してください。

IronXLをインストール

Visual Studio Codeで、[ターミナル] > [新しいターミナル] を選択してターミナルウィンドウを開きます。

IronXLをインストールするには、pipパッケージマネージャーを使用します:

pip install IronXL

Visual Studio Codeを使用してPythonでExcelファイルを読み取る方法: 図3 - pipパッケージマネージャーを使用してIronXLをインストールする

IronXLを使用してExcelファイルを読み取る

Excelファイルの読み取りはIronXLを使用して数行のコードで簡単に行うことができます。 まず、Excelワークブックに保存されているデータを取得して開くために必要なコードを作成しましょう。

from ironxl import *
workbook = WorkBook.Load("Demo.xlsx")
worksheet = workbook.WorkSheets [0]
for cell in worksheet ["A2:A10"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

IronXLライブラリをインポートすることで、そのすべての機能にアクセスできます。 次に、ironxl.open_workbook関数を使用して、ユーザーが操作したいMicrosoft Excelファイルを読み込みます。 以下の例では、Excelワークブックのパスをパラメーターとして渡すことができます。ここでは .xlsx ファイルを渡しています。同様に、CSVファイルをパラメーターとして渡すこともできます。 Excelファイルのワークシートには複数のシートを含めることができるので、IronXLは複数のシートにアクセスして利用するためのメソッドを提供しています。

次に、ワークブックから複数のExcelシートをワークシート名を使用して取り出すか、ワークシート名が分からない場合はインデックスでAccessしてExcelシートを開きます。 ご要件に応じて、IronXLはさまざまなデータアクセスオプションを提供します。 シートから、A2からA10までのExcel範囲を取得できます。その後、forループを使用して、値を一つずつ表示することができます。

Visual Studio Codeを使用してPythonでExcelファイルを読み取る方法:図4 - すべてのセルのテキストと関連する値を出力するループを呼び出した際のコンソール出力

上記のコードは IronXL を使用して Excel ファイルを読み込み、スクリーンショットに示されているようにすべてのデータをコンソールに表示します。

IronXLのコードスニペットや関連する例について詳しく知るには、ドキュメントを参照してください。

結論

全体として、IronXLはExcelファイルを扱うための強力で適応性のあるPythonライブラリです。 データの読み取りやアクセスに加えて、多様な操作を簡素化します。 IronXLは、開発者がPythonアプリケーション内でワークフローを自動化し、Excel関連のタスクを効率化することを可能にします。 主な機能には、スプレッドシートの作成と編集、セルの書式設定、数式の処理、およびチャートの生成が含まれます。

その主な利点には、直感的なAPI、Microsoft Officeからの独立、および他のExcelファイル形式との互換性があります。 IronXLは、Excelに保存されている大規模なデータセットのクリーンアップと処理、レポート生成の自動化、およびExcelファイルを他の形式にエクスポートするために必要なツールを提供します。

IronXL は無料オプションを提供しています。 彼らはより完全に機能し、より多くの機能とサポートを提供します。 ライセンスに関する包括的で最新の情報については、IronXLのウェブサイトをご覧ください。 私たちは、開発者の生産性を向上させ、運用を効率化するために、他の関連ソフトウェアのスイートも提供しています。 こちらのウェブサイトを訪れて、Iron Software製品について詳しく学んでください。

チャクニット・ビン
ソフトウェアエンジニア
ChaknithはIronXLとIronBarcodeで作業しています。彼はC#と.NETに深い専門知識を持ち、ソフトウェアの改善と顧客サポートを支援しています。ユーザーとの対話から得た彼の洞察は、より良い製品、文書、および全体的な体験に貢献しています。
< 以前
PythonでExcelファイルを修正する(開発者チュートリアル)
次へ >
PythonでExcelにエクスポートする方法