二項分布


二項分布

二項分布は離散分布です。

バイナリシナリオの結果を説明します。たとえば、コインを投げると、頭か尾のどちらかになります。

これには3つのパラメーターがあります。

n -試行回数。

p -各試行の発生確率(たとえば、それぞれ0.5枚のコインを投げる場合)。

size -返された配列の形状。

離散分布:分布は、個別のイベントセットで定義されます。たとえば、コイントスの結果は、頭または尾のみであるため離散的ですが、人の身長は170、170.1、170.11などで連続的です。

コイントスを10回試行すると、10個のデータポイントが生成されます。

from numpy import random

x = random.binomial(n=10, p=0.5, size=10)

print(x)

二項分布の可視化

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

sns.distplot(random.binomial(n=10, p=0.5, size=1000), hist=True, kde=False)

plt.show()

結果


正規分布と二項分布の違い

主な違いは、正規分布は連続的であるのに対し、二項式は離散的であるということですが、十分なデータポイントがある場合は、特定の位置とスケールを持つ正規分布と非常によく似ています。

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

sns.distplot(random.normal(loc=50, scale=5, size=1000), hist=False, label='normal')
sns.distplot(random.binomial(n=100, p=0.5, size=1000), hist=False, label='binomial')

plt.show()

結果