Pythonのpandasライブラリにおけるlocの利用方法について現役エンジニアが解説【初心者向け】

初心者向けにPythonのpandasライブラリにおけるlocの利用方法について現役エンジニアが解説しています。pandasとは、データ解析や機械学習を行うためのライブラリです。locとはDataFrame型のデータの要素を参照するための方法です。CSVデータを使ったlocの書き方や使い方を解説します。

TechAcademyマガジンはオンラインのプログラミングスクールTechAcademy [テックアカデミー]が運営。初心者向けに解説した記事が4,000以上あります。現役エンジニアの方はこちらをご覧ください。

Pythonのpandasライブラリにおけるlocの利用方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して初心者向けに解説します。

そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonのpandasライブラリにおけるlocの利用方法について詳しく説明していくね!

大石ゆかり

お願いします!

この記事では、Pythonにおけるデータ解析のためのライブラリであるpandasにおけるlocの使い方について解説します。

目次

 

pandasとは

まずは、pandasについて簡単に説明しておきます。

pandasというのは、Pythonにおいてデータ解析を効率的に行うためのライブラリです。CSVデータを読み込んだり、読み込んだ結果をグラフ化したり、分析をしてファイルに書き込む、などといったことができるようになっています。

また、機械学習においてもデータの前処理などで頻繁に使われています。データ解析、機械学習では必須のライブラリで、非常に便利でかんたんに使うことができて重宝されています。

詳しい解説はデータ分析のライブラリ!Pandasとはを参考にしてみてください。

[PR] Pythonで挫折しない学習方法を動画で公開中

locとは

pandasではデータを読み込む際に、DataFrameというデータ型を用います。

このDataFrame型では、要素を参照するためには、行と列のラベルを指定する必要がありますが、直接指定するだけだとリストなどの場合と少し異なるため混乱してしまうことがよくあります。

そこで、要素を参照するための方法がDataFrameには用意されていますが、その1つにlocがあります。locは、行と列のラベル名を指定して1つの要素、もしくは範囲を指定して複数の要素を参照することができます。

具体的には、

DataFrame型変数.loc['行ラベル名', '列ラベル名']

のようにして指定することで、指定した行、列についての要素が返ってきます。複数の行、列を指定したい場合には、行ラベル名のリスト、列ラベル名のリストを用いて、

DataFrame型変数.loc[['行ラベル名1', '行ラベル名2', ...], ['列ラベル名1', '列ラベル名2', ...]]

のように指定することができます。また、ラベルの指定の部分ではスライス表記をすることもできて、

DataFrame型変数.loc['行ラベル名1' : '行ラベル名2', '列ラベル名1':'列ラベル名2']

のようにすることもできます。

locを利用してcsvデータの値を取得してみよう

それでは、実際にコードを記述してみて、locを使ってデータの値を取得してみましょう。(出力はjupyter notebookを用いたものです。)

# ライブラリのインポート
import pandas as pd
from sklearn import datasets

# 使うデータをダウンロード
iris = datasets.load_iris()

# データをDataFrameに変換
df = pd.DataFrame(iris.data, columns= iris.feature_names)

# DataFrameの先頭の5行を表示
df.head(5)

出力

# locを用いて行が1、列が'sepal width (cm)'の要素を取得
df.loc[1, 'sepal width (cm)']

出力

3.0

 # locを用いて行が1,3,5、列が'sepal width (cm)', 'petal width (cm)'の要素を取得
df.loc[[1,3,5], ['sepal width (cm)', 'petal width (cm)']]

出力

# locを用いて行が1から5まで、列が'sepal width (cm)'から'petal width (cm)'までの要素を取得
df.loc[1:5, 'sepal width (cm)':'petal width (cm)']

出力

まとめ

この記事ではpandasを用いてDataFrameの要素を指定して参照するlocの使い方について解説しました。pandasの基本的な使い方でもあるので覚えておくと良いでしょう。

監修してくれたメンター

小倉翔悟(おぐらしょうご)

AIプログラミングを使って開発を行う大学3年生。

プログラミング歴は約3年でPythonは割と得意。好きな物理理論は一般相対性理論で動物も好き。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも最短4週間でPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。

挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。