エクセルツール

Pythonを使用してExcelファイルを読み取る方法

チャクニット・ビン
チャクニット・ビン
2024年3月6日
共有:

イントロダクション

マイクロソフトExcelファイルは、今日のデータ駆動環境において重要なデータを保存および整理するために不可欠です。 Excelファイルには財務データ、販売データ、または科学研究の結果が含まれることがあり、さまざまなビジネスで広く使用されています。

Pythonには、Excelファイルを容易に読み取り、操作することができる強力なライブラリ環境があります。 この記事では、Pythonを使用してExcelファイルを読み取る方法を検討します。

この投稿では、IronXLがC#でExcelファイルを読み取る際にPythonライブラリの強力な代替となる理由についても見ていきます。その機能、使いやすさ、性能の利点を探り、有用なコードサンプルを使ってその能力を紹介します。

PythonでExcelファイルを読み取る方法

  1. 必要なライブラリを取り込む。

  2. Excelファイルを読み取るには、ライブラリの関数を使用してください。

  3. 必要に応じて、ファイルの場所に加えて、シート名や範囲などの追加パラメータを含めてください。

  4. 情報を変数に入れる。

  5. オプションの手順としてデータ処理やデータクレンジングを行います。

  6. データを分析または操作に進みます。

Pandas-Excel-Reader

Pandasの上に開発されたPandas-Excel-Readerと呼ばれる専門ライブラリは、Excelファイルを読み込むための強化された機能を提供します。 Pandasの組み込みread_excel()関数のように、Excelスプレッドシートからデータを抽出してPandasのDataFrameに変換するための高レベルインターフェースを提供します。

一方、Pandas-Excel-Readerは、データ読み込みの高速化、大きなExcelファイルのサポート強化、そして以前のPandasバージョンとの下位互換性などの追加機能を提供します。

通常のPandas read_excel()メソッドを使用している際に、大規模なデータセットを処理したり、速度の問題を抱えている開発者にとって、このパッケージは特に役立ちます。

Pythonを使用してExcelファイルを読み取る方法: 図1

パイエクセレレート

PyExcelerate は、Excelファイルを迅速に、かつメモリ使用量を抑えて生成する小さなPythonモジュールです。 PyExcelerateは主にExcelファイルの作成に関心がありますが、Excelファイルを読み取るための機能も備えています。

PyExcelerateは、既存のExcelファイルからPythonのデータ構造(リストや辞書を含む)にデータをインポートすることを開発者に可能にします。 PyExcelerateの効率と速度に対する焦点は、データ分析や報告などの迅速なExcel読み取りを伴う活動に適しています。

PythonでExcelファイルを読み取る方法: 図2

パンダス-エクセル-ライター

Pandas の補助ライブラリである Pandas-Excel-Writer は、特に Excel ファイルを作成するために作られています。 Pandas DataFrameのExcelへのエクスポートが主な機能である一方で、Pandas-Excel-Writerは既存のExcelファイルからデータを読み取ることもできます。

開発者は、Pandas-Excel-Writerを使用して、Excelファイル内の特定のワークシートや範囲からデータを抽出することで、データ抽出プロセスにおける柔軟性と制御を持つことができます。

Pandas-Excel-Writerの滑らかなインターフェースはPandasと連携しており、Excelファイルの読み込みや書き込みを容易にするため、開発者はPythonアプリケーションで効率的にExcelファイルを管理できます。

XlTable

軽量のPythonライブラリであるXlTableは、Excelテーブルの読み取りと変更のために、使いやすさとシンプルさに焦点を当てた設計になっています。 開発者は、Excelテーブルを扱う際に、この高レベルインターフェースを使用してデータを抽出し、フィルターを適用し、テーブルデータに対して基本的な操作を実行できます。

XlTableは他の一部のライブラリほど機能が豊富ではないものの、Excelテーブルを操作するための使いやすい方法を提供します。そのため、基本的なExcel読み取り作業やコードのオーバーヘッドが少ないプロジェクトに適しています。

PythonでExcelファイルを読む方法: 図3

Python-Excel

Excel ドキュメントの読み取り、書き込み、変更は、Excel ファイルを操作するための豊富な機能を持つ Python ライブラリであるPython-Excelを利用して可能です。 Python-Excel は、Excel ファイルの処理やデータ抽出のための堅牢な機能セットを提供しますが、他のいくつかのライブラリほど人気があるわけではありません。

Python-Excelは、開発者がレポートを作成したり、Excelファイルからデータを抽出したり、データ分析を行うために使用できます。 Python-Excelは、PythonでExcelファイルを操作するための完全なソリューションを探している開発者に、強力なAPIと豊富なドキュメントを提供します。 競争力のあるオプションです。

Pythonを使用してExcelファイルを読み取る方法: 図4

IronXL

IronXLは、Excelファイルを操作するための機能豊富なC#ライブラリです。 IronXL は、Iron Software によって作成され、Excel ドキュメントをプログラムによって読み込み、編集し、変更するための包括的な機能を提供します。

IronXLは、使いやすいAPIと充実したドキュメントにより、C#でのExcel操作をスムーズにすることで、開発者に快適な体験を提供します。

IronXLの機能

  • 広範なExcelサポート: IronXLは多数のExcelファイルに対応しており、xlsxファイル、xls、csvなどの複数のExcel形式をサポートします。IronXLには強力な解析機能があり、最新のExcelスプレッドシートでも古い形式でも、開発者がデータを効果的に抽出できます。
  • 高速: IronXLは速度最適化に重点を置いています。 信頼性が高く迅速なExcelの操作を保証するために、効果的なアルゴリズムとメモリ管理戦略を利用しています。 IronXLはメモリのオーバーヘッドを削減し、処理速度を最適化したため、開発者は大規模なExcelファイルを簡単に処理できます。
  • シンプルで使いやすいAPI:IronXLのシンプルで使いやすいAPIは、あらゆる経験レベルの開発者にとって適しています。 IronXL は、Excel ファイルの読み書きを簡素化し、C# 開発者にとっての学習曲線を低減します。これは、Excel ファイルを読み、Excel ワークブックにアクセスし、セルからデータを取得するための簡単な方法を提供することによって実現されます。
  • 細かな制御: IronXLは開発者に細かな制御を提供し、特定の高レベルライブラリとは対照的に、セルレベルまでExcelドキュメントを操作できるようにします。 個々のセル、行、列、およびワークシートにアクセスする機能を持つことで、開発者は特定のニーズに応じてデータを正確に抽出および操作することができます。
  • クロスプラットフォーム互換性: IronXLはWindows、Linux、macOSなどさまざまなオペレーティングシステムで動作するため、クロスプラットフォームC#プログラミングに適しています。 いくつかの設定で一貫したExcel操作を行うために、開発者はデスクトップ、オンライン、モバイルアプリケーションを作成する際にIronXLを利用できます。

    IronXL のドキュメントについて詳しくは、こちらをご覧ください。

IronXLのインストール

IronXLをインストールするには、コマンドラインと以下の手順を使用してください。

Visual Studioで、ツール -> NuGetパッケージ管理 -> パッケージマネージャーインターフェース に移動します。

パッケージマネージャーのコンソールタブに次のコードを入力してください:

pip install IronXL

ファイルは現在ダウンロードされ、アクティブなプロジェクトにインストールされており、使用する準備が整いました。

C#におけるIronXL: Excelデータの読み取り

それでは、IronXLを使用してExcelデータをC#で読み取る方法を示す有用なコードサンプルを見てみましょう。 既存のExcelファイルを開き、ワークシートデータを取得し、特定のセルの値を取得する方法について説明します。

using IronXL;
class Program
{
    static void Main(string [] args)
    {
        // Specify the path to the xlsx file
        string filePath = "SampleData.xlsx";
        // Create a new WorkBook object
        WorkBook workBook = WorkBook.Load(filePath);
        // Get the first worksheet from the Excel file
        WorkSheet workSheet = workBook.WorkSheets.First();
        // Retrieve data from specific cells
        string cellA1 = workSheet ["A1"].Value.ToString();
        string cellB1 = workSheet ["B1"].Value.ToString();
        // Display the retrieved data
        Console.WriteLine("Value of cell A1: " + cellA1);
        Console.WriteLine("Value of cell B1: " + cellB1);
        // Close the workbook
        workBook.Close();
    }
}
PYTHON

このコードサンプルでは、最初にExcelファイル(「SampleData.xlsx」)へのパスを定義します。 次に、IronXLのLoad()関数を使用して新しいWorkBookオブジェクトを構築し、ファイルの場所を入力として提供します。

最初のExcelシートはExcelファイルから開かれ、セル参照(例えば「A1」や「B2」)を使用して特定のセルにアクセスします。 最後に、Console.WriteLine() 関数を使用して、これらのセル値から取得したデータを表示します。 私たちはIronXLを使用して複数のExcelシートを読み取ります。

上記のコード例では、以下の画像に示されている新しいExcelワークブックを作成しました。

Pythonを使用してExcelファイルを読み取る方法: 図5

以下は上記のコードから生成された出力です。 IronXLのコードについて詳しく知りたい場合はこちらを参照してください。

Pythonを使用してExcelファイルを読む方法: 図6

結論

PythonのExcelファイルを読み込みおよびインポートする能力は、報告、自動化、およびデータ分析のための無限の可能性をもたらします。 Excelファイルからのデータは、Pythonプログラマーによって簡単に抽出、変更、分析できます。

推奨されるプラクティスに従い、これらのライブラリの機能を活用することで、開発者はExcelファイルの読み取りプロセスを最適化し、データに隠された重要な洞察を見つけることができます。

一方、IronXLはC#開発者にとって強力なExcelファイルの読み取り代替手段であり、完全なExcel互換性、優れたパフォーマンス、および.NETフレームワークとのスムーズな連携を提供します。

IronXLは、その使いやすいAPIと細やかなExcelドキュメント制御により、C#でのExcel操作をより簡単にします。 これは、開発者が複数のシートやファイル、または単一のExcelワークシートを扱う際に、自分のアプリケーションでExcelデータを効率的に管理するのに役立ちます。

C#開発者はIronXLに依存して、Excel関連のプロセスを簡素化し、デスクトップ、オンライン、またはモバイルアプリを作成するかどうかに関係なく、C#プログラム内でExcelの完全な機能を利用できるようにすることができます。

$749に関しては、IronXLはローンチ時に利用可能です。 アップデートと製品サポートを希望するユーザーは、1年間のメンバーシップ料金を支払うこともできます。 追加料金で、IronXLは無制限の再配布に対する安全性を提供します。 おおよその費用について詳しくは、こちらのリンクをご覧ください。

リンクをクリックしてIron Softwareについて詳しくご覧ください。

チャクニット・ビン
ソフトウェアエンジニア
ChaknithはIronXLとIronBarcodeで作業しています。彼はC#と.NETに深い専門知識を持ち、ソフトウェアの改善と顧客サポートを支援しています。ユーザーとの対話から得た彼の洞察は、より良い製品、文書、および全体的な体験に貢献しています。
< 以前
PythonでExcelファイルを書く方法