統計学
統計とは、データを収集、分析、解釈、および提示する方法に関するものです。
- 最も一般的なものは何ですか?
- 最も期待されるものは何ですか?
- 最も正常なものは何ですか?
推論統計
推論統計は、小さなサンプルから母集団の特性を定量化するための方法です。
サンプルからデータを取得し、母集団全体について予測します。
たとえば、お店に立って、100人のサンプルにチョコレートが好きかどうか尋ねることができます。
あなたの調査から、推論統計を使用して、すべての買い物客の91%がチョコレートを好むと予測できます。
信じられないほどのチョコレートの事実
10人に9人がチョコレートが大好きです。
米国の人口の50%は、チョコレートなしでは毎日生きられません。
記述統計
記述統計は、観察結果を私たちが理解できる情報に要約するための方法です。
生まれたばかりの赤ちゃんをすべて登録しているので、100人中51人が男の子であることがわかります。
収集した数値から、51%の確率で新しい赤ちゃんが男の子になると予測できます。
基本的な生物学が予測するように、比率が50%ではないのは謎です。少なくとも17世紀以来、この傾斜した性比を持っているとしか言えません。
平均値
平均値は、すべての値の平均です。
この表には、住宅価格とサイズが含まれています。
価格 | 7 | 8 | 8 | 9 | 9 | 9 | 10 | 11 | 14 | 14 | 15 |
サイズ | 50 | 60 | 70 | 80 | 90 | 100 | 110 | 120 | 130 | 140 | 150 |
平均価格は(7 + 8 + 8 + 9 + 9 + 9 + 10 + 11 + 14 + 14 + 15)/ 11 = 10.363636です。
方法:すべての数値を加算してから、数値の数で割ります。
平均は、合計をカウントで割ったものです。
平均値(JavaScriptの場合):
var mean = (7+8+8+9+9+9+10+11+14+14+15)/11;
または、 math.jsのような数学ライブラリを使用する場合:
var mean = math.mean([7,8,8,9,9,9,10,11,14,14,15]);
分散
統計では、分散は平均値からの差の2乗の平均です。
つまり、一連の数値が平均値からどれだけ離れているかを表します。
差異(JavaScriptの場合):
// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+14+15)/11;
// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;
// Calculate the Variance
var variance = ss / 11;
または、 math.jsのような数学ライブラリを使用する場合:
var variance = math.variance([7,8,8,9,9,9,10,11,14,14,15],"uncorrected");
標準偏差
標準偏差は、数値がどの程度広がっているかを示す尺度です。
記号はσ(ギリシャ文字のシグマ)です。
式は√分散(分散の平方根)です。
標準偏差は(JavaScriptで)次のとおりです。
// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+15)/11;
// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;
// Calculate the Variance
var variance = ss / 11;
// Calculate the Standard Deviation
var std = Math.sqrt(variance);
または、 math.jsのような数学ライブラリを使用する場合:
var std = math.std([7,8,8,9,9,9,9,10,11,14,15],"uncorrected");
正規分布
正規分布曲線はベル型の曲線です。
曲線の各バンドの幅は1標準偏差です。