データサイエンス機能
この章では、データサイエンスを操作するときに一般的に使用される、max()、min()、mean()の3つの関数を示します。
スポーツウォッチデータセット
間隔 | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
上記のデータセットは6つの変数で構成され、それぞれに10個の観測値があります。
- 期間-トレーニングセッションは何分で続きましたか?
- Average_Pulse-トレーニングセッションの平均脈拍はどれくらいでしたか?これは1分あたりの拍数で測定されます
- Max_Pulse-トレーニングセッションの最大脈拍は何でしたか?
- Calorie_Burnage-トレーニングセッションでどのくらいのカロリーが消費されましたか?
- Hours_Work-トレーニングセッションの前に、私たちは何時間仕事をしましたか?
- Hours_Sleep-トレーニングセッションの前夜、どれくらい眠りましたか?
Pythonはスペースを区切り文字として読み取ることができないため、文字列を区切るためにアンダースコア(_)を使用します。
max()関数
Pythonmax()
関数は、配列内の最大値を見つけるために使用されます。
例
Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_max)
min()関数
Pythonmin()
関数は、配列内の最小値を見つけるために使用されます。
例
Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_min)
mean()関数
NumPymean()
関数は、配列の平均値を見つけるために使用されます。
例
import numpy as np
Calorie_burnage =
[240, 250, 260, 270, 280, 290, 300, 310, 320, 330]
Average_calorie_burnage =
np.mean(Calorie_burnage)
print(Average_calorie_burnage)
npと書きます。平均の前で、 Numpyライブラリから平均関数をアクティブ化することをPythonに通知します。