二項分布
二項分布
二項分布は離散分布です。
バイナリシナリオの結果を説明します。たとえば、コインを投げると、頭か尾のどちらかになります。
これには3つのパラメーターがあります。
n
-試行回数。
p
-各試行の発生確率(たとえば、それぞれ0.5枚のコインを投げる場合)。
size
-返された配列の形状。
離散分布:分布は、個別のイベントセットで定義されます。たとえば、コイントスの結果は、頭または尾のみであるため離散的ですが、人の身長は170、170.1、170.11などで連続的です。
例
コイントスを10回試行すると、10個のデータポイントが生成されます。
from numpy import random
x = random.binomial(n=10, p=0.5, size=10)
print(x)
二項分布の可視化
例
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
sns.distplot(random.binomial(n=10, p=0.5, size=1000), hist=True, kde=False)
plt.show()
結果
正規分布と二項分布の違い
主な違いは、正規分布は連続的であるのに対し、二項式は離散的であるということですが、十分なデータポイントがある場合は、特定の位置とスケールを持つ正規分布と非常によく似ています。
例
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
sns.distplot(random.normal(loc=50, scale=5, size=1000), hist=False,
label='normal')
sns.distplot(random.binomial(n=100, p=0.5, size=1000), hist=False,
label='binomial')
plt.show()