データサイエンス-統計標準偏差


標準偏差

標準偏差は、観測値がどの程度広がっているかを表す数値です。

標準偏差

観測値が「広がっている」場合、数学関数は正確な値を予測するのが困難になります。標準偏差は不確かさの尺度です。

標準偏差が低いということは、ほとんどの数値が平均(平均)値に近いことを意味します。

標準偏差が高いということは、値がより広い範囲に分散していることを意味します。

標準偏差は、多くの場合、記号Sigma:σで表されます。

std()Numpyの関数を使用して、変数の標準偏差を見つけることができます。

import numpy as np

std = np.std(full_health_data)
print(std)

出力:

標準偏差

これらの数字はどういう意味ですか?


変動係数

変動係数は、標準偏差がどれだけ大きいかを知るために使用されます。

数学的には、変動係数は次のように定義されます。

Coefficient of Variation = Standard Deviation / Mean

 次のコードを実行すると、Pythonでこれを実行できます。

import numpy as np

cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)

出力:

変動係数

変数Duration、Calorie_Burnage、およびHours_Workは、Max_Pulse、Average_Pulse、およびHours_Sleepと比較して標準偏差が高いことがわかります。