データサイエンス-データベーステーブル


データベーステーブル

データベーステーブルは、構造化データを含むテーブルです。

次の表は、スポーツウォッチから抽出された健康データを含むデータベーステーブルを示しています。

間隔 Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

このデータセットには、継続時間、平均脈拍、カロリー燃焼などの一般的なトレーニングセッションの情報が含まれています。


データベーステーブルの構造

データベーステーブルは、列と行で構成されています。

列1 列2 列3 列4 5列目 6列目
間隔 Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
行1 30 80 120 240 10 7
行2 30 85 120 250 10 7
行3 45 90 130 260 8 7
行4 45 95 130 270 8 7
行5 45 100 140 280 0 7
行6 60 105 140 290 7 8
行7 60 110 145 300 7 8
行8 60 115 145 310 8 8
9行目 75 120 150 320 0 8
行10 75 125 150 330 8 8

行はデータの水平方向の表現です。

列は、データの垂直方向の表現です。


変数

変数は、測定またはカウントできるものとして定義されます。

例としては、文字、数字、時間などがあります。

以下の例では、各列が変数を表していることがわかります。

間隔 Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

6つの列があり、6つの変数(Duration、Average_Pulse、Max_Pulse、Calorie_Burnage、Hours_Work、Hours_Sleep)があることを意味します。

11行あります。つまり、各変数には10個の観測値があります。

しかし、11行ある場合、なぜ10個の観測値しかないのでしょうか。

これは、最初の行がラベルであり、変数の名前であることを意味しているためです。