データサイエンス-データベーステーブル
データベーステーブル
データベーステーブルは、構造化データを含むテーブルです。
次の表は、スポーツウォッチから抽出された健康データを含むデータベーステーブルを示しています。
間隔 | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
このデータセットには、継続時間、平均脈拍、カロリー燃焼などの一般的なトレーニングセッションの情報が含まれています。
データベーステーブルの構造
データベーステーブルは、列と行で構成されています。
列1 | 列2 | 列3 | 列4 | 5列目 | 6列目 | |
間隔 | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep | |
---|---|---|---|---|---|---|
行1 | 30 | 80 | 120 | 240 | 10 | 7 |
行2 | 30 | 85 | 120 | 250 | 10 | 7 |
行3 | 45 | 90 | 130 | 260 | 8 | 7 |
行4 | 45 | 95 | 130 | 270 | 8 | 7 |
行5 | 45 | 100 | 140 | 280 | 0 | 7 |
行6 | 60 | 105 | 140 | 290 | 7 | 8 |
行7 | 60 | 110 | 145 | 300 | 7 | 8 |
行8 | 60 | 115 | 145 | 310 | 8 | 8 |
9行目 | 75 | 120 | 150 | 320 | 0 | 8 |
行10 | 75 | 125 | 150 | 330 | 8 | 8 |
行はデータの水平方向の表現です。
列は、データの垂直方向の表現です。
変数
変数は、測定またはカウントできるものとして定義されます。
例としては、文字、数字、時間などがあります。
以下の例では、各列が変数を表していることがわかります。
間隔 | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
6つの列があり、6つの変数(Duration、Average_Pulse、Max_Pulse、Calorie_Burnage、Hours_Work、Hours_Sleep)があることを意味します。
11行あります。つまり、各変数には10個の観測値があります。
しかし、11行ある場合、なぜ10個の観測値しかないのでしょうか。
これは、最初の行がラベルであり、変数の名前であることを意味しているためです。