Pythonのgroupbyメソッドを使う方法【初心者向け】

初心者向けにPythonのPandasライブラリのgroupbyメソッドの使い方について解説しています。groupbyを使うことでグループごとにデータを集計し、その最大値や最小値を求めることができます。groupbyの書き方と実行結果を実際の例で確認しましょう。

TechAcademyマガジンはオンラインのプログラミングスクールTechAcademy [テックアカデミー]が運営する教育×テクノロジーのWebメディアです。初心者でもすぐ勉強できる記事が2,000以上あります。

PythonのPandasライブラリのgroupbyメソッドの使い方について解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事をまずご覧ください。

 

なお本記事は、TechAcademyのPythonオンライン講座の内容をもとにしています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pandasライブラリのgroupbyメソッドの使い方について詳しく説明していくね!

大石ゆかり

お願いします!

 

groupbyメソッドとは

groupbyメソッドとは、pandasモジュールのDataFrameで利用できるメソッドです。

通常DataFrameは何らかの軸(例えば年月や性別)を含みます。

軸ごとにデータを集約し、平均値、最大値、最小値などを計算するためにgroupbyメソッドを使います。

 

groupbyメソッドの使い方

DataFrameオブジェクトに対し、groupbyメソッドを呼び出します。引数には複数指定できるものがありますが、byかlevelの指定が必須です。

byでは辞書、関数、ラベルを指定できます。

詳細は公式の文書を参照してください。

import pandas as pd
df = pd.DataFrame() # DataFrameインスタンスの作成
# dfに対する操作
grouped = df.groupby(by=...) # groupbyメソッドで集計

 

[PR] Pythonで挫折しない学習方法を動画で公開中

実際に書いてみよう

サンプルコード

import seaborn as sns

iris = sns.load_dataset('iris')
print(iris.head())
print(iris.groupby('species').mean())

 

実行結果

   sepal_length  sepal_width  petal_length  petal_width species
0           5.1          3.5           1.4          0.2  setosa
1           4.9          3.0           1.4          0.2  setosa
2           4.7          3.2           1.3          0.2  setosa
3           4.6          3.1           1.5          0.2  setosa
4           5.0          3.6           1.4          0.2  setosa

            sepal_length  sepal_width  petal_length  petal_width
species
setosa             5.006        3.428         1.462        0.246
versicolor         5.936        2.770         4.260        1.326
virginica          6.588        2.974         5.552        2.026

 

解説

1,3行目でseabornモジュールをインポートし、組み込みのデータセット(iris=アヤメ)を読み込んでいます。

4行目でデータフレームの先頭5要素を表示しました。
なお、irisデータセットは150件のデータを含んでいます。

データの意味は左から順に萼片の長さ、萼弁の幅、花弁の長さ、花弁の幅、種別を示しています。

5行目でspecies(種別)で集計した上で、mean(平均値)を計算しています。

結果、種別ごとに萼片の長さ等の平均値が表示されました。

 

監修してくれたメンター

橋本紘希

システムインテグレータ企業勤務のシステムエンジニア。
開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

オンラインのプログラミングスクールTechAcademyではPythonを使って機械学習の基礎を学ぶPythonオンライン講座を開催しています。

初心者向けの書籍を使って人工知能(AI)や機械学習について学ぶことができます。

現役エンジニアがパーソナルメンターとして受講生に1人ずつつき、マンツーマンのメンタリングで学習をサポートし、最短4週間で習得することが可能です。

また、現役エンジニアから学べる無料のプログラミング体験会も実施しているので、ぜひ参加してみてください。