パンダシリーズ


シリーズとは何ですか?

パンダシリーズは、テーブルの列のようなものです。

これは、あらゆるタイプのデータを保持する1次元配列です。

リストから簡単なパンダシリーズを作成します。

import pandas as pd

a = [1, 7, 2]

myvar = pd.Series(a)

print(myvar)

ラベル

他に何も指定されていない場合、値にはインデックス番号のラベルが付けられます。最初の値のインデックスは0、2番目の値のインデックスは1などです。

このラベルは、指定された値にアクセスするために使用できます。

シリーズの最初の値を返します。

print(myvar[0])

ラベルを作成する

引数を使用するindexと、独自のラベルに名前を付けることができます。

独自のラベルを作成します。

import pandas as pd

a = [1, 7, 2]

myvar = pd.Series(a, index = ["x", "y", "z"])

print(myvar)

ラベルを作成したら、ラベルを参照してアイテムにアクセスできます。

「y」の値を返します。

print(myvar["y"])

w3schools CERTIFIED . 2021

認定を受けましょう!

Pandasモジュールを完了し、演習を行い、試験を受けると、w3schoolsの認定を受けます。

$ 10登録

シリーズとしてのキー/値オブジェクト

シリーズを作成するときに、辞書などのキー/値オブジェクトを使用することもできます。

辞書から簡単なパンダシリーズを作成します。

import pandas as pd

calories = {"day1": 420, "day2": 380, "day3": 390}

myvar = pd.Series(calories)

print(myvar)

注:辞書のキーがラベルになります。

ディクショナリ内の一部のアイテムのみを選択するには、index 引数を使用して、シリーズに含めるアイテムのみを指定します。

「day1」と「day2」のデータのみを使用してシリーズを作成します。

import pandas as pd

calories = {"day1": 420, "day2": 380, "day3": 390}

myvar = pd.Series(calories, index = ["day1", "day2"])

print(myvar)

DataFrames

パンダのデータセットは通常、DataFrameと呼ばれる多次元テーブルです。

Seriesは列のようなもので、DataFrameはテーブル全体です。

2つのシリーズからDataFrameを作成します。

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

myvar = pd.DataFrame(data)

print(myvar)

次の章でDataFrameについて学習します。


エクササイズで自分をテストする

エクササイズ:

正しいパンダメソッドを挿入して、シリーズを作成します。

pd.(mylist)