Pythonのpandasを利用してデータの行数をカウントする方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonのpandasを利用してデータの行数をカウントする方法について現役エンジニアが解説しています。pandasとはPython用のデータ分析ライブラリで、Excelのようなデータフレーム形式を扱うことが出来ます。データの行数を取得するには、shapeプロパティやlenメソッドを使います。

TechAcademyマガジンはオンラインのプログラミングスクールTechAcademy [テックアカデミー]が運営する教育×テクノロジーのWebメディアです。初心者でもすぐ勉強できる記事が2,000以上あります。

Pythonのpandasを利用してデータの行数をカウントする方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonのpandasを利用してデータの行数をカウントする方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

pandasとは

pandasとはPython用のデータ分析ライブラリです。

高性能で使いやすいデータ構造とデータ解析ツールをはじめデータフレーム形式を扱うことができます。データフレーム形とは普段しているExcelやスプレッドシートのようなデータ構造になります。

pandasについてはこちらの記事も参照ください。

データ分析のライブラリ!Pandasとは【初心者向け】

データの行数をカウントする方法

今回はpandasを使ってデータの行数をカウントする方法について紹介します。pandasでデータの行数をカウントするには以下の文法を使用します。

df.shape

このコードを使用すると、指定したデータフレームの行数と列数がタプル型で返されます。また、Pythonの組み込み関数len()を使用して下記文法で行数を取得することもできます。

len(df)

 

[PR] Pythonで挫折しない学習方法を動画で公開中

実際に書いてみよう

それでは、サンプルコードを参考にpandasを利用してデータの行数をカウントするコードを実際に書いてみましょう。

df.shapeを使用する場合

サンプルコード

import pandas as pd

# データフレームの作成
df = pd.DataFrame({
        'A' : [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7, 8, 9, 10],
        'B' : [1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 8, 8, 8]
    })

# df.shapeを使用して行数をカウントする
print(df.shape[0])

 

実行結果

21

 

解説

コード1行目-7行目では、pandasを使用する準備とデータフレームの作成を行っています。コード10行目では、df.shapeを使用してデータフレームの行数を取得し、出力しています。

注意点として、df.shapeでの返り値はタプル型で(行数,列数)となっている為、行数のみ取得したい場合はdf.shape[0]と書きます。実行結果では指定したデータフレームの行数が出力されています。

len()関数を使用する場合

サンプルコード

import pandas as pd

# データフレームの作成
df = pd.DataFrame({
        'A' : [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7, 8, 9, 10],
        'B' : [1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 8, 8, 8]
    })

# len関数を使用して行数をカウントする
print(len(df))

 

実行結果

21

 

解説

コード1行目-7行目では、pandasを使用する準備とデータフレームの作成を行っています。コード10行目では、len()関数を使用してデータフレームの行数を取得し、出力しています。こちらはdf.shapeとは違ってそのままデータフレームの行数が取得できます。

len関数を使って列数を取得したい場合は、len(df.colums)と書くことでデータフレームの列数を取得することができます。

実行結果では指定したデータフレームの行数が出力されています。

まとめ

今回は、Pythonのpandasを利用してデータの行数をカウントする方法について紹介しました。

Pandasではデータの前処理や整形等にもよく使われます、今回紹介した手法も使用頻度が高いのでしっかりと習得しましょう。

監修してくれたメンター

菅繕久(すがよしひこ)

現在はフリーランスのエンジニアをしていてプログラミング歴は8年目になります。

普段は Python、FileMaker等を使って様々な業務で活用できるIoTプロダクトRPAツールを作成しています。
開発実績としては、業務自動化ツール(在庫管理・発注・ファイル操作 etc)、電子カルテシステム、ロボット用プログラムなどがあります。
TechAcademyではPythonコースを担当しております。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも最短4週間で、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。

また、現役エンジニアから学べる無料体験も実施しているので、ぜひ参加してみてください。