パンダDataFrames
DataFrameとは何ですか?
Pandas DataFrameは、2次元配列、または行と列を持つテーブルのような2次元データ構造です。
例
簡単なPandasDataFrameを作成します。
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
#load data into a DataFrame object:
df = pd.DataFrame(data)
print(df)
結果
calories duration 0 420 50 1 380 40 2 390 45
行を検索
上記の結果からわかるように、DataFrameは行と列を持つテーブルのようなものです。
パンダはloc
属性を使用して、指定された1つ以上の行を返します
例
行0を返します:
#refer to the row index:
print(df.loc[0])
結果
calories 420 duration 50 Name: 0, dtype: int64
注:この例では、Pandasシリーズが返されます。
例
行0と1を返します。
#use a list of indexes:
print(df.loc[[0, 1]])
結果
calories duration 0 420 50 1 380 40
注:を使用する[]
と、結果はPandasDataFrameになります。
名前付きインデックス
引数を使用するindex
と、独自のインデックスに名前を付けることができます。
例
名前のリストを追加して、各行に名前を付けます。
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2",
"day3"])
print(df)
結果
calories duration day1 420 50 day2 380 40 day3 390 45
名前付きインデックスを見つける
属性で名前付きインデックスを使用してloc
、指定された行を返します。
例
「day2」を返す:
#refer to the named index:
print(df.loc["day2"])
結果
calories 380 duration 40 Name: 0, dtype: int64
データフレームへのファイルのロード
データセットがファイルに保存されている場合、PandasはそれらをDataFrameにロードできます。
例
カンマ区切りファイル(CSVファイル)をDataFrameにロードします。
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
次の章で、ファイルのインポートについて詳しく学習します。