パンダシリーズ
シリーズとは何ですか?
パンダシリーズは、テーブルの列のようなものです。
これは、あらゆるタイプのデータを保持する1次元配列です。
例
リストから簡単なパンダシリーズを作成します。
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a)
print(myvar)
ラベル
他に何も指定されていない場合、値にはインデックス番号のラベルが付けられます。最初の値のインデックスは0、2番目の値のインデックスは1などです。
このラベルは、指定された値にアクセスするために使用できます。
例
シリーズの最初の値を返します。
print(myvar[0])
ラベルを作成する
引数を使用するindex
と、独自のラベルに名前を付けることができます。
例
独自のラベルを作成します。
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar)
ラベルを作成したら、ラベルを参照してアイテムにアクセスできます。
例
「y」の値を返します。
print(myvar["y"])
シリーズとしてのキー/値オブジェクト
シリーズを作成するときに、辞書などのキー/値オブジェクトを使用することもできます。
例
辞書から簡単なパンダシリーズを作成します。
import pandas as pd
calories = {"day1": 420, "day2": 380, "day3":
390}
myvar = pd.Series(calories)
print(myvar)
注:辞書のキーがラベルになります。
ディクショナリ内の一部のアイテムのみを選択するには、index
引数を使用して、シリーズに含めるアイテムのみを指定します。
例
「day1」と「day2」のデータのみを使用してシリーズを作成します。
import pandas as pd
calories = {"day1": 420, "day2": 380, "day3":
390}
myvar = pd.Series(calories,
index = ["day1", "day2"])
print(myvar)
DataFrames
パンダのデータセットは通常、DataFrameと呼ばれる多次元テーブルです。
Seriesは列のようなもので、DataFrameはテーブル全体です。
例
2つのシリーズからDataFrameを作成します。
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
myvar = pd.DataFrame(data)
print(myvar)
次の章でDataFrameについて学習します。