機械学習-平均中央値モード
平均、中央値、最頻値
数字のグループを見ることから何を学ぶことができますか?
機械学習(および数学)では、多くの場合、私たちが興味を持っている3つの価値観があります。
- 平均-平均値
- 中央値-中点値
- モード-最も一般的な値
例:13台の車の速度を登録しました:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
平均、中間、または最も一般的な速度値は何ですか?
平均
平均値は平均値です。
平均を計算するには、すべての値の合計を見つけ、その合計を値の数で割ります。
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 =
89.77
NumPyモジュールにはこのためのメソッドがあります。NumPyチュートリアルでNumPyモジュールについて学びます。
例
NumPymean()
メソッドを使用して、平均速度を見つけます。
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)
中央値
中央値は、すべての値を並べ替えた後の中央の値です。
77, 78, 85, 86, 86, 86,
87
, 87, 88, 94, 99, 103, 111
中央値を見つける前に、数値を並べ替えることが重要です。
NumPyモジュールにはこのためのメソッドがあります:
例
NumPymedian()
メソッドを使用して、中間値を見つけます。
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
中央に2つの数値がある場合は、それらの数値の合計を2で割ります。
77, 78, 85, 86, 86,
86, 87
,
87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5
例
NumPyモジュールの使用:
import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
モード
モード値は、最も多く表示される値です。
99,
86
, 87, 88, 111,
86
, 103, 87, 94, 78, 77, 85,
86
= 86
SciPyモジュールにはこのためのメソッドがあります。SciPyチュートリアルでSciPyモジュールについて学びます 。
例
SciPymode()
メソッドを使用して、最も多く表示される番号を見つけます。
from scipy import stats
speed =
[99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)
章のまとめ
平均、中央値、最頻値は機械学習でよく使用される手法であるため、その背後にある概念を理解することが重要です。