機械学習-正規データ分布
正規データ分布
前の章では、指定されたサイズで、指定された2つの値の間に完全にランダムな配列を作成する方法を学びました。
この章では、値が特定の値に集中する配列を作成する方法を学習します。
確率論では、この種のデータ分布は、このデータ分布の公式を考案した数学者カールフリードリヒガウスにちなんで、正規データ分布またはガウスデータ分布として知られています。
例
典型的な正規データ分布:
import numpy
import matplotlib.pyplot as plt
x =
numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
結果:
注:正規分布グラフは、ベルの特徴的な形状のため、ベルカーブとも呼ばれ ます。
ヒストグラムの説明
メソッドの配列numpy.random.normal()
を100000の値で使用して、100本の棒でヒストグラムを描画します。
平均値を5.0、標準偏差を1.0と指定します。
値は5.0前後に集中する必要があり、平均から1.0より遠くなることはめったにないことを意味します。
また、ヒストグラムからわかるように、ほとんどの値は4.0から6.0の間で、上限は約5.0です。