ランダムなデータ配布
データ配信とは何ですか?
データ分布は、すべての可能な値のリストであり、各値が発生する頻度です。
このようなリストは、統計やデータサイエンスを扱うときに重要です。
ランダムモジュールは、ランダムに生成されたデータ分布を返すメソッドを提供します。
ランダム分布
ランダム分布は、特定の確率密度関数に従う乱数のセットです。
確率密度関数: 連続確率を表す関数。つまり、配列内のすべての値の確率。
モジュールのchoice()
方法を
使用して、定義された確率に基づいて乱数を生成でき
ます。random
このchoice()
方法では、各値の確率を指定できます。
確率は0から1までの数値で設定されます。ここで、0は値が発生しないことを意味し、1は値が常に発生することを意味します。
例
100個の値を含む1次元配列を生成します。各値は、3、5、7、または9である必要があります。
値が3になる確率は0.1に設定されます
値が5になる確率は0.3に設定されます
値が7になる確率は0.6に設定されます
値が9になる確率は0に設定されます
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(100))
print(x)
すべての確率数の合計は1でなければなりません。
上記の例を100回実行しても、値9は発生しません。
パラメータで形状を指定することにより、任意の形状とサイズの配列を返すことができ
size
ます。
例
上記と同じ例ですが、それぞれ5つの値を含む3行の2次元配列を返します。
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(3, 5))
print(x)