パンダDataFrames


DataFrameとは何ですか?

Pandas DataFrameは、2次元配列、または行と列を持つテーブルのような2次元データ構造です。

簡単なPandasDataFrameを作成します。

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df) 

結果

     calories  duration
  0       420        50
  1       380        40
  2       390        45


行を検索

上記の結果からわかるように、DataFrameは行と列を持つテーブルのようなものです。

パンダはloc属性を使用して、指定された1つ以上の行を返します

行0を返します:

#refer to the row index:
print(df.loc[0])

結果

  calories    420
  duration     50
  Name: 0, dtype: int64

注:この例では、Pandasシリーズが返されます。

行0と1を返します。

#use a list of indexes:
print(df.loc[[0, 1]])

結果

     calories  duration
  0       420        50
  1       380        40

注:を使用する[]と、結果はPandasDataFrameになります。


w3schools CERTIFIED . 2021

認定を受けましょう!

Pandasモジュールを完了し、演習を行い、試験を受けると、w3schoolsの認定を受けます。

$ 10登録

名前付きインデックス

引数を使用するindexと、独自のインデックスに名前を付けることができます。

名前のリストを追加して、各行に名前を付けます。

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df) 

結果

        calories  duration
  day1       420        50
  day2       380        40
  day3       390        45

名前付きインデックスを見つける

属性で名前付きインデックスを使用してloc、指定された行を返します。

「day2」を返す:

#refer to the named index:
print(df.loc["day2"])

結果

  calories    380
  duration     40
  Name: 0, dtype: int64


データフレームへのファイルのロード

データセットがファイルに保存されている場合、PandasはそれらをDataFrameにロードできます。

カンマ区切りファイル(CSVファイル)をDataFrameにロードします。

import pandas as pd

df = pd.read_csv('data.csv')

print(df) 

次の章で、ファイルのインポートについて詳しく学習します。


エクササイズで自分をテストする

エクササイズ:

正しいPandasメソッドを挿入して、DataFrameを作成します。

pd.(data)