データサイエンス-統計標準偏差
標準偏差
標準偏差は、観測値がどの程度広がっているかを表す数値です。
観測値が「広がっている」場合、数学関数は正確な値を予測するのが困難になります。標準偏差は不確かさの尺度です。
標準偏差が低いということは、ほとんどの数値が平均(平均)値に近いことを意味します。
標準偏差が高いということは、値がより広い範囲に分散していることを意味します。
標準偏差は、多くの場合、記号Sigma:σで表されます。
std()
Numpyの関数を使用して、変数の標準偏差を見つけることができます。
例
import numpy as np
std = np.std(full_health_data)
print(std)
出力:
これらの数字はどういう意味ですか?
変動係数
変動係数は、標準偏差がどれだけ大きいかを知るために使用されます。
数学的には、変動係数は次のように定義されます。
Coefficient of Variation = Standard Deviation / Mean
次のコードを実行すると、Pythonでこれを実行できます。
例
import numpy as np
cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)
出力:
変数Duration、Calorie_Burnage、およびHours_Workは、Max_Pulse、Average_Pulse、およびHours_Sleepと比較して標準偏差が高いことがわかります。