PythonのライブラリPandasでの要素取得の書き方を現役エンジニアが解説【初心者向け】

初心者向けにPythonのライブラリPandasでの要素取得の書き方について解説しています。Pandasはデータ処理のライブラリになります。機械学習や深層学習の精度に影響するのはインプットするデータの質です。今回は分析業務で頻出の基礎について解説します。

TechAcademyマガジンはオンラインのプログラミングスクールTechAcademy [テックアカデミー]が運営する教育×テクノロジーのWebメディアです。初心者でもすぐ勉強できる記事が2,000以上あります。

PythonのライブラリPandasでの要素取得の書き方について解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事をまずご覧ください。

 

なお本記事は、TechAcademyのPythonオンライン講座の内容をもとにしています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

ライブラリPandasでの要素取得の書き方について詳しく説明していくね!

大石ゆかり

お願いします!

 

ライブラリPandasのDataFrame

Pandasでは1次元配列のSeries、2次元配列のDataFrame、(あまり使うことはないですが)3次元配列のPanelでデータを扱います。

DataFrameとはわかりやすく言うと、Excelのような行と列の組み合わせでできているデータのことです。

 

ライブラリPandasのDataFrameの要素取得のための属性(loc, iloc, at iat, ix など)

前述のとおり、行と列の組み合わせでデータが構成されているので、欲しいデータを取得するためには「n行目のm列目の値が欲しい」などのように指定をする必要があります。 ここでは要素取得の方法(属性)をいくつか説明します。

 

loc

行ラベル、列ラベルで要素を指定します。’:’と組み合わせることで、行全体や列全体、指定範囲の行や列のデータを取得できます。

 

iloc

行番号、列番号で要素を指定します。’:’と組み合わせることで、行全体や列全体、指定範囲の行や列のデータを取得できます。

 

at, iat

atは行ラベルと列ラベルで、iatは行番号と列番号で要素を指定します。loc、ilocとの違いは複数要素を取得できないことです。

 

ix

行番号、列番号で要素を指定します。’:’と組み合わせることで、行全体や列全体、指定範囲の行や列のデータを取得できます。 ※Pandas v0.20.0以降では非推奨となっているため、できるだけ使わない方が良いでしょう。

 

要素取得のための各属性(loc,iloc,at iat,ixなど)の比較

  • 指定方法
    • ラベルで指定: `loc`、`at`
    • 番号で指定: `iloc`、`iat`、`ix`
  • 取得要素数
    • 単一: `at`、`iat`
    • 複数: `loc`、`iloc`、`ix`

 

[PR] Pythonで挫折しない学習方法を動画で公開中

要素取得のための各属性(loc,iloc,at iat,ixなど)の書き方

loc

単一の要素を取得 df.loc[“label_row”, “label_col”]
行全体を取得 df.loc[“label_row”]、もしくは df.loc[“label_row”, :]
列全体を取得 df.loc[:, “label_col”]
指定範囲の要素を取得 df.loc[“label_row_a”:”label_row_b”, “label_col_a”:”label_col_b”]

 

iloc

単一の要素を取得 df.loc[0, 1]
行全体を取得 df.loc[0]、もしくは df.loc[0, :]
列全体を取得 df.loc[:, 1]
指定範囲の要素を取得 df.loc[0:2, 1:3]

 

at iat

at df.at[“label_row”, “label_col”] iat df.iat[0, 1]

 

ix

単一の要素を取得 df.ix[0, 1]
行全体を取得 df.ix[0]、もしくは df.ix[0, :]
列全体を取得 df.ix[:, 1]
指定範囲の要素を取得 df.ix[0:2, 1:3]
 

実際に書いてみよう

サンプルコード

Pandasのimport、データ準備
 

import pandas as pd from pandas 
import DataFrame 

df = DataFrame({"name": ["Aki", "Ben", "Chris"], "age": [19, 25, 33], "height": [142, 185, 161], "score": [97, 85, 77]}, index=["a", "b", "c"])   

 
以下のデータを使って要素取得を試してみましょう。

loc

“a”行の”name”を取得 df.loc[“a”, “name”]
全行の”name”を取得 df.loc[:, “name”]
“a”行の全データを取得 df.loc[“a”]
“a”行から”b”行の、”height”,”score”を取得 df.loc[“a”:”b”, “height”:”score”]

name age height score
a Aki 19 142 97
b Ben 25 185 85
c Chris 33 161 77
height score
a 142 97
b 185 85

 

iloc

“b”行の”height”を取得 df.loc[1, 2]
全行の”height”を取得 df.loc[:, 2]
“b”行の全データを取得 df.loc[1]
“a”行から”b”行の、”height”,”score”を取得 df.loc[0:2, 2:4]

※locと異なり、欲しいデータの次の行番号や列番号を終端として指定する必要があるので注意しましょう。

 

at iat

“a”行の”name”を取得 df.at[“a”, “name”] df.iat[0, 0]
 

ix

“b”行の”height”を取得 df.ix[1, 2]
全行の”height”を取得 df.ix[:, 2]
“b”行の全データを取得 df.ix[1]
“a”行から”b”行の、”height”,”score”を取得 df.ix[0:2, 2:4]

※locと異なり、欲しいデータの次の行番号や列番号を終端として指定する必要があるので注意しましょう。

 

監修してくれたメンター

メンター稲員さん

フリーランスエンジニア。
大手SEからフリーランスのWeb系エンジニアにジョブチェンジ。

経験言語:Ruby, Rails, Python, C/C++, Java, Perl, HTML/CSS3, JavaScript, CoffeeScript, Node.js
おうち大好きマンです。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

オンラインのプログラミングスクールTechAcademyではPythonを使って機械学習の基礎を学ぶPythonオンライン講座を開催しています。

初心者向けの書籍を使って人工知能(AI)や機械学習について学ぶことができます。

現役エンジニアがパーソナルメンターとして受講生に1人ずつつき、マンツーマンのメンタリングで学習をサポートし、最短4週間で習得することが可能です。

また、現役エンジニアから学べる無料のプログラミング体験会も実施しているので、ぜひ参加してみてください。