データサイエンス機能


この章では、データサイエンスを操作するときに一般的に使用される、max()、min()、mean()の3つの関数を示します。


スポーツウォッチデータセット

間隔 Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

上記のデータセットは6つの変数で構成され、それぞれに10個の観測値があります。

  • 期間-トレーニングセッションは何分で続きましたか?
  • Average_Pulse-トレーニングセッションの平均脈拍はどれくらいでしたか?これは1分あたりの拍数で測定されます
  • Max_Pulse-トレーニングセッションの最大脈拍は何でしたか?
  • Calorie_Burnage-トレーニングセッションでどのくらいのカロリーが消費されましたか?
  • Hours_Work-トレーニングセッションの前に、私たちは何時間仕事をしましたか?
  • Hours_Sleep-トレーニングセッションの前夜、どれくらい眠りましたか?

Pythonはスペースを区切り文字として読み取ることができないため、文字列を区切るためにアンダースコア(_)を使用します。



max()関数

Pythonmax()関数は、配列内の最大値を見つけるために使用されます。

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

min()関数

Pythonmin()関数は、配列内の最小値を見つけるために使用されます。

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

mean()関数

NumPymean()関数は、配列の平均値を見つけるために使用されます。

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

npと書きます。平均の前で、 Numpyライブラリから平均関数をアクティブ化することをPythonに通知します。