オーダーメイドコース
icon
icon

PythonのライブラリPandasでの要素取得の書き方を現役エンジニアが解説【初心者向け】

初心者向けにPythonのライブラリPandasでの要素取得の書き方について解説しています。Pandasはデータ処理のライブラリになります。機械学習や深層学習の精度に影響するのはインプットするデータの質です。今回は分析業務で頻出の基礎について解説します。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日  調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名  調査手法:インターネット調査

PythonのライブラリPandasでの要素取得の書き方について解説します。

そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

ライブラリPandasでの要素取得の書き方について詳しく説明していくね!

大石ゆかり

お願いします!

 

ライブラリPandasのDataFrame

Pandasでは1次元配列のSeries、2次元配列のDataFrame、(あまり使うことはないですが)3次元配列のPanelでデータを扱います。

DataFrameとはわかりやすく言うと、Excelのような行と列の組み合わせでできているデータのことです。

 

ライブラリPandasのDataFrameの要素取得のための属性(loc, iloc, at iat, ix など)

前述のとおり、行と列の組み合わせでデータが構成されているので、欲しいデータを取得するためには「n行目のm列目の値が欲しい」などのように指定をする必要があります。 ここでは要素取得の方法(属性)をいくつか説明します。

 

loc

行ラベル、列ラベルで要素を指定します。’:’と組み合わせることで、行全体や列全体、指定範囲の行や列のデータを取得できます。

 

iloc

行番号、列番号で要素を指定します。’:’と組み合わせることで、行全体や列全体、指定範囲の行や列のデータを取得できます。

 

at, iat

atは行ラベルと列ラベルで、iatは行番号と列番号で要素を指定します。loc、ilocとの違いは複数要素を取得できないことです。

 

ix

行番号、列番号で要素を指定します。’:’と組み合わせることで、行全体や列全体、指定範囲の行や列のデータを取得できます。 ※Pandas v0.20.0以降では非推奨となっているため、できるだけ使わない方が良いでしょう。

 

要素取得のための各属性(loc,iloc,at iat,ixなど)の比較

  • 指定方法
    • ラベルで指定: `loc`、`at`
    • 番号で指定: `iloc`、`iat`、`ix`
  • 取得要素数
    • 単一: `at`、`iat`
    • 複数: `loc`、`iloc`、`ix`

 

[PR] 未経験からWebエンジニアを目指す方法とは

要素取得のための各属性(loc,iloc,at iat,ixなど)の書き方

loc

単一の要素を取得 df.loc[“label_row”, “label_col”]
行全体を取得 df.loc[“label_row”]、もしくは df.loc[“label_row”, :]
列全体を取得 df.loc[:, “label_col”]
指定範囲の要素を取得 df.loc[“label_row_a”:”label_row_b”, “label_col_a”:”label_col_b”]

 

iloc

単一の要素を取得 df.loc[0, 1]
行全体を取得 df.loc[0]、もしくは df.loc[0, :]
列全体を取得 df.loc[:, 1]
指定範囲の要素を取得 df.loc[0:2, 1:3]

 

at iat

at df.at[“label_row”, “label_col”] iat df.iat[0, 1]

 

ix

単一の要素を取得 df.ix[0, 1]
行全体を取得 df.ix[0]、もしくは df.ix[0, :]
列全体を取得 df.ix[:, 1]
指定範囲の要素を取得 df.ix[0:2, 1:3]
 

実際に書いてみよう

サンプルコード

Pandasのimport、データ準備
 

import pandas as pd from pandas 
import DataFrame 

df = DataFrame({"name": ["Aki", "Ben", "Chris"], "age": [19, 25, 33], "height": [142, 185, 161], "score": [97, 85, 77]}, index=["a", "b", "c"])   

 
以下のデータを使って要素取得を試してみましょう。

loc

“a”行の”name”を取得 df.loc[“a”, “name”]
全行の”name”を取得 df.loc[:, “name”]
“a”行の全データを取得 df.loc[“a”]
“a”行から”b”行の、”height”,”score”を取得 df.loc[“a”:”b”, “height”:”score”]

name age height score
a Aki 19 142 97
b Ben 25 185 85
c Chris 33 161 77
height score
a 142 97
b 185 85

 

iloc

“b”行の”height”を取得 df.loc[1, 2]
全行の”height”を取得 df.loc[:, 2]
“b”行の全データを取得 df.loc[1]
“a”行から”b”行の、”height”,”score”を取得 df.loc[0:2, 2:4]

※locと異なり、欲しいデータの次の行番号や列番号を終端として指定する必要があるので注意しましょう。

 

at iat

“a”行の”name”を取得 df.at[“a”, “name”] df.iat[0, 0]
 

ix

“b”行の”height”を取得 df.ix[1, 2]
全行の”height”を取得 df.ix[:, 2]
“b”行の全データを取得 df.ix[1]
“a”行から”b”行の、”height”,”score”を取得 df.ix[0:2, 2:4]

※locと異なり、欲しいデータの次の行番号や列番号を終端として指定する必要があるので注意しましょう。

 

監修してくれたメンター

メンター稲員さん

フリーランスエンジニア。
大手SEからフリーランスのWeb系エンジニアにジョブチェンジ。

経験言語:Ruby, Rails, Python, C/C++, Java, Perl, HTML/CSS3, JavaScript, CoffeeScript, Node.js
おうち大好きマンです。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でもPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。

挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。