パンダDataFrames

DataFrameとは何ですか？

Pandas DataFrameは、2次元配列、または行と列を持つテーブルのような2次元データ構造です。

例

簡単なPandasDataFrameを作成します。

import pandas as pd

data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df)

結果

     calories  duration
  0       420        50
  1       380        40
  2       390        45

行を検索

上記の結果からわかるように、DataFrameは行と列を持つテーブルのようなものです。

パンダはloc属性を使用して、指定された1つ以上の行を返します

例

行0を返します：

#refer to the row index:
print(df.loc[0])

結果

  calories    420
  duration     50
  Name: 0, dtype: int64

注：この例では、Pandasシリーズが返されます。

例

行0と1を返します。

#use a list of indexes:
print(df.loc[[0, 1]])

結果

     calories  duration
  0       420        50
  1       380        40

注：を使用する[]と、結果はPandasDataFrameになります。

認定を受けましょう！

Pandasモジュールを完了し、演習を行い、試験を受けると、w3schoolsの認定を受けます。

$ 10登録

名前付きインデックス

引数を使用するindexと、独自のインデックスに名前を付けることができます。

例

名前のリストを追加して、各行に名前を付けます。

import pandas as pd

data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df)

結果

        calories  duration
  day1       420        50
  day2       380        40
  day3       390        45

名前付きインデックスを見つける

属性で名前付きインデックスを使用してloc、指定された行を返します。

例

「day2」を返す：

#refer to the named index:
print(df.loc["day2"])

結果

  calories    380
  duration     40
  Name: 0, dtype: int64

データフレームへのファイルのロード

データセットがファイルに保存されている場合、PandasはそれらをDataFrameにロードできます。

例

カンマ区切りファイル（CSVファイル）をDataFrameにロードします。

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

次の章で、ファイルのインポートについて詳しく学習します。

❮ 前次 ❯

パンダ攻略

クリーニングデータ

相関関係

プロット

クイズ/演習

参考文献