統計学

統計とは、データを収集、分析、解釈、および提示する方法に関するものです。

  • 最も一般的なものは何ですか?
  • 最も期待されるものは何ですか?
  • 最も正常なものは何ですか?

推論統計

推論統計は、小さなサンプルから母集団の特性を定量化するための方法です。

サンプルからデータを取得し、母集団全体について予測します。

たとえば、お店に立って、100人のサンプルにチョコレートが好きかどうか尋ねることができます。

あなたの調査から、推論統計を使用して、すべての買い物客の91%がチョコレートを好むと予測できます。


信じられないほどのチョコレートの事実

10人に9人がチョコレートが大好きです。

米国の人口の50%は、チョコレートなしでは毎日生きられません。


記述統計

記述統計は、観察結果を私たちが理解できる情報に要約するための方法です。

生まれたばかりの赤ちゃんをすべて登録しているので、100人中51人が男の子であることがわかります。

収集した数値から、51%の確率で新しい赤ちゃんが男の子になると予測できます。

基本的な生物学が予測するように、比率が50%ではないのは謎です。少なくとも17世紀以来、この傾斜した性比を持っているとしか言えません。


平均値

平均値は、すべての値の平均です。

この表には、住宅価格とサイズが含まれています。

価格7889991011141415
サイズ5060708090100 110120130140150

平均価格は(7 + 8 + 8 + 9 + 9 + 9 + 10 + 11 + 14 + 14 + 15)/ 11 = 10.363636です。

方法:すべての数値を加算してから、数値の数で割ります。

平均は、合計をカウントで割ったものです

平均値(JavaScriptの場合):

var mean = (7+8+8+9+9+9+10+11+14+14+15)/11;

または、 math.jsのような数学ライブラリを使用する場合

var mean = math.mean([7,8,8,9,9,9,10,11,14,14,15]);


分散

統計では、分散は平均値からの差の2乗の平均です。

つまり、一連の数値が平均値からどれだけ離れているかを表します。

差異(JavaScriptの場合):

// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+14+15)/11;

// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;

// Calculate the Variance
var variance = ss / 11;

または、 math.jsのような数学ライブラリを使用する場合

var variance = math.variance([7,8,8,9,9,9,10,11,14,14,15],"uncorrected");


標準偏差

標準偏差は、数値がどの程度広がっているかを示す尺度です。

記号はσ(ギリシャ文字のシグマ)です。

式は分散(分散の平方根)です。

標準偏差は(JavaScriptで)次のとおりです。

// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+15)/11;

// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;

// Calculate the Variance
var variance = ss / 11;

// Calculate the Standard Deviation
var std = Math.sqrt(variance);

または、 math.jsのような数学ライブラリを使用する場合

var std = math.std([7,8,8,9,9,9,9,10,11,14,15],"uncorrected");


正規分布

正規分布曲線はベル型の曲線です

曲線の各バンドの幅は1標準偏差です。

標準正規分布