ランダムなデータ配布


データ配信とは何ですか?

データ分布は、すべての可能な値のリストであり、各値が発生する頻度です。

このようなリストは、統計やデータサイエンスを扱うときに重要です。

ランダムモジュールは、ランダムに生成されたデータ分布を返すメソッドを提供します。


ランダム分布

ランダム分布は、特定の確率密度関数に従う乱数のセットです

確率密度関数: 連続確率を表す関数。つまり、配列内のすべての値の確率。

モジュールのchoice()方法を 使用して、定義された確率に基づいて乱数を生成でき ます。random

このchoice()方法では、各値の確率を指定できます。

確率は0から1までの数値で設定されます。ここで、0は値が発生しないことを意味し、1は値が常に発生することを意味します。

100個の値を含む1次元配列を生成します。各値は、3、5、7、または9である必要があります。

値が3になる確率は0.1に設定されます

値が5になる確率は0.3に設定されます

値が7になる確率は0.6に設定されます

値が9になる確率は0に設定されます

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

print(x)

すべての確率数の合計は1でなければなりません。

上記の例を100回実行しても、値9は発生しません。

パラメータで形状を指定することにより、任意の形状とサイズの配列を返すことができ sizeます。

上記と同じ例ですが、それぞれ5つの値を含む3行の2次元配列を返します。

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

print(x)