PythonのライブラリPandasでの要素取得の書き方を現役エンジニアが解説【初心者向け】
初心者向けにPythonのライブラリPandasでの要素取得の書き方について解説しています。Pandasはデータ処理のライブラリになります。機械学習や深層学習の精度に影響するのはインプットするデータの質です。今回は分析業務で頻出の基礎について解説します。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
PythonのライブラリPandasでの要素取得の書き方について解説します。
そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。
なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
ライブラリPandasでの要素取得の書き方について詳しく説明していくね!
お願いします!
ライブラリPandasのDataFrame
Pandasでは1次元配列のSeries、2次元配列のDataFrame、(あまり使うことはないですが)3次元配列のPanelでデータを扱います。
DataFrameとはわかりやすく言うと、Excelのような行と列の組み合わせでできているデータのことです。
ライブラリPandasのDataFrameの要素取得のための属性(loc, iloc, at iat, ix など)
前述のとおり、行と列の組み合わせでデータが構成されているので、欲しいデータを取得するためには「n行目のm列目の値が欲しい」などのように指定をする必要があります。 ここでは要素取得の方法(属性)をいくつか説明します。
loc
行ラベル、列ラベルで要素を指定します。’:’と組み合わせることで、行全体や列全体、指定範囲の行や列のデータを取得できます。
iloc
行番号、列番号で要素を指定します。’:’と組み合わせることで、行全体や列全体、指定範囲の行や列のデータを取得できます。
at, iat
atは行ラベルと列ラベルで、iatは行番号と列番号で要素を指定します。loc、ilocとの違いは複数要素を取得できないことです。
ix
行番号、列番号で要素を指定します。’:’と組み合わせることで、行全体や列全体、指定範囲の行や列のデータを取得できます。 ※Pandas v0.20.0以降では非推奨となっているため、できるだけ使わない方が良いでしょう。
要素取得のための各属性(loc,iloc,at iat,ixなど)の比較
- 指定方法
- ラベルで指定: `loc`、`at`
- 番号で指定: `iloc`、`iat`、`ix`
- 取得要素数
- 単一: `at`、`iat`
- 複数: `loc`、`iloc`、`ix`
要素取得のための各属性(loc,iloc,at iat,ixなど)の書き方
loc
単一の要素を取得 df.loc[“label_row”, “label_col”]
行全体を取得 df.loc[“label_row”]、もしくは df.loc[“label_row”, :]
列全体を取得 df.loc[:, “label_col”]
指定範囲の要素を取得 df.loc[“label_row_a”:”label_row_b”, “label_col_a”:”label_col_b”]
iloc
単一の要素を取得 df.loc[0, 1]
行全体を取得 df.loc[0]、もしくは df.loc[0, :]
列全体を取得 df.loc[:, 1]
指定範囲の要素を取得 df.loc[0:2, 1:3]
at iat
at df.at[“label_row”, “label_col”] iat df.iat[0, 1]
ix
単一の要素を取得 df.ix[0, 1]
行全体を取得 df.ix[0]、もしくは df.ix[0, :]
列全体を取得 df.ix[:, 1]
指定範囲の要素を取得 df.ix[0:2, 1:3]
実際に書いてみよう
サンプルコード
Pandasのimport、データ準備
import pandas as pd from pandas import DataFrame df = DataFrame({"name": ["Aki", "Ben", "Chris"], "age": [19, 25, 33], "height": [142, 185, 161], "score": [97, 85, 77]}, index=["a", "b", "c"])
以下のデータを使って要素取得を試してみましょう。
name | age | height | score | |
---|---|---|---|---|
a | Aki | 19 | 142 | 97 |
b | Ben | 25 | 185 | 85 |
c | Chris | 33 | 161 | 77 |
height | score | |
---|---|---|
a | 142 | 97 |
b | 185 | 85 |
iloc
“b”行の”height”を取得 df.loc[1, 2]
全行の”height”を取得 df.loc[:, 2]
“b”行の全データを取得 df.loc[1]
“a”行から”b”行の、”height”,”score”を取得 df.loc[0:2, 2:4]
※locと異なり、欲しいデータの次の行番号や列番号を終端として指定する必要があるので注意しましょう。
at iat
“a”行の”name”を取得 df.at[“a”, “name”] df.iat[0, 0]
ix
“b”行の”height”を取得 df.ix[1, 2]
全行の”height”を取得 df.ix[:, 2]
“b”行の全データを取得 df.ix[1]
“a”行から”b”行の、”height”,”score”を取得 df.ix[0:2, 2:4]
※locと異なり、欲しいデータの次の行番号や列番号を終端として指定する必要があるので注意しましょう。
監修してくれたメンター
メンター稲員さん
フリーランスエンジニア。 経験言語:Ruby, Rails, Python, C/C++, Java, Perl, HTML/CSS3, JavaScript, CoffeeScript, Node.js |
内容分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でもPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。
挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。
記事を検索
関連するキーワード
ハウツー関連する記事
Pythonで文字列長をカウントする方法を現役エンジニアが解説【初心者向け】
Pythonでファイルに書き込む方法【初心者向け】
Pythonのrandomモジュールで疑似乱数を作成する方法を現役エンジニアが解説【初心者向け】
PythonでCSVファイルの指定した行を削除する方法を現役エンジニアが解説【初心者向け】
近年、Pythonの人気が高い理由を現役エンジニアが解説【初心者向け】
PythonのPyomoモジュールについて現役エンジニアが解説【初心者向け】
あわせてよく読まれている記事
データ分析のライブラリ!Pandasとは【初心者向け】|現役エンジニアが解説
Pythonのpandasライブラリの使い方について現役エンジニアが解説【初心者向け】
PHPの配列でjoinメソッドを使う方法を現役エンジニアが解説【初心者向け】
サイズ指定に役立つ!CSSでcalc( )を使う方法【初心者向け】
JavaScriptでDOM操作で要素を削除する方法を現役エンジニアが解説【初心者向け】
福岡のパソコン教室20選|特徴や料金を表で比較
あなたの目的に合わせて学べるコース
※ 経済産業省の行うリスキリングを通じたキャリアアップ支援事業の補助金対象コースです。条件を満たすことで支払った受講料の最大70%がキャッシュバックされます。詳しくは こちら のページをご確認ください。