Pythonチュートリアル

Pythonホーム Pythonイントロ Pythonはじめに Python構文 Pythonコメント Python変数 Pythonデータ型 Python番号 Pythonキャスティング Python文字列 Pythonブール値 Python演算子 Pythonリスト Pythonタプル Pythonセット Python辞書 Python If ... Else PythonのWhileループ PythonForループ Python関数 Python Lambda Python配列 Pythonクラス/オブジェクト Pythonの継承 Pythonイテレータ Pythonスコープ Pythonモジュール Pythonの日付 Python数学 Python JSON Python RegEx Python PIP Python試してみてください... Pythonユーザー入力 Python文字列フォーマット

ファイル処理

Pythonファイル処理 Python読み取りファイル Python書き込み/ファイルの作成 Pythonファイルの削除

Pythonモジュール

NumPyチュートリアル パンダ攻略 Scipyチュートリアル

Python Matplotlib

Matplotlibイントロ Matplotlibはじめに Matplotlib Pyplot Matplotlibプロット Matplotlibマーカー Matplotlibライン Matplotlibラベル Matplotlibグリッド Matplotlibサブプロット Matplotlib散布図 Matplotlibバー Matplotlibヒストグラム Matplotlib円グラフ

機械学習

入門 平均中央値モード 標準偏差 パーセンタイル データ配信 正規データ分布 散布図 線形回帰 多項式回帰 重回帰 規模 トレーニング/テスト デシジョンツリー

Python MySQL

MySQLはじめに MySQLデータベースの作成 MySQLテーブルの作成 MySQL挿入 MySQL Select MySQL Where MySQL Order By MySQL削除 MySQLドロップテーブル MySQLアップデート MySQLの制限 MySQL参加

Python MongoDB

MongoDBはじめに MongoDBデータベースの作成 MongoDBCreateコレクション MongoDBインサート MongoDB検索 MongoDBクエリ MongoDBソート MongoDB削除 MongoDBドロップコレクション MongoDBアップデート MongoDBの制限

Pythonリファレンス

Pythonの概要 Python組み込み関数 Python文字列メソッド Pythonリストメソッド Python辞書メソッド Pythonタプルメソッド Pythonセットメソッド Pythonファイルメソッド Pythonキーワード Pythonの例外 Python用語集

モジュールリファレンス

ランダムモジュール リクエストモジュール 統計モジュール 数学モジュール cMathモジュール

Pythonハウツー

リストの重複を削除する 文字列を逆にする 2つの数字を追加する

Pythonの例

Pythonの例 Pythonコンパイラ Python演習 Pythonクイズ Python証明書

機械学習-標準偏差


標準偏差とは何ですか?

標準偏差は、値がどの程度広がっているかを表す数値です。

標準偏差が低いということは、ほとんどの数値が平均(平均)値に近いことを意味します。

標準偏差が高いということは、値がより広い範囲に分散していることを意味します。

例:今回は7台の車の速度を登録しました:

speed = [86,87,88,86,87,85,86]

標準偏差は次のとおりです。

0.9

ほとんどの値が平均値86.4から0.9の範囲内にあることを意味します。

より広い範囲の数値を選択して同じことを行いましょう。

speed = [32,111,138,28,59,77,97]

標準偏差は次のとおりです。

37.85

ほとんどの値が平均値77.4から37.85の範囲内にあることを意味します。

ご覧のとおり、標準偏差が高いほど、値がより広い範囲に広がっていることを示しています。

NumPyモジュールには、標準偏差を計算する方法があります。

NumPystd()メソッドを使用して、標準偏差を見つけます。

import numpy

speed = [86,87,88,86,87,85,86]

x = numpy.std(speed)

print(x)

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.std(speed)

print(x)


分散

分散は、値がどの程度広がっているかを示すもう1つの数値です。

実際、分散の平方根を取ると、標準偏差が得られます。

または、逆に、標準偏差をそれ自体で乗算すると、分散が得られます。

分散を計算するには、次のようにする必要があります。

1.平均を求めます。

(32+111+138+28+59+77+97) / 7 = 77.4

2.各値について:平均からの差を見つけます。

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

3.それぞれの違いについて:二乗値を見つけます。

(-45.4)2 = 2061.16
 (33.6)2 = 1128.96
 (60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 =  338.56
(- 0.4)2 =    0.16
 (19.6)2 =  384.16

4.分散は、これらの2乗された差の平均数です。

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

幸い、NumPyには分散を計算する方法があります。

NumPyvar()メソッドを使用して、分散を見つけます。

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.var(speed)

print(x)

標準偏差

私たちが学んだように、標準偏差を見つけるための式は、分散の平方根です。

1432.25 = 37.85

または、前の例のように、NumPyを使用して標準偏差を計算します。

NumPystd()メソッドを使用して、標準偏差を見つけます。

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.std(speed)

print(x)

記号

標準偏差は、多くの場合、記号Sigma: σで表されます。

分散は、多くの場合、記号Sigma Squareで表されます:σ2


章のまとめ

標準偏差と分散は機械学習でよく使用される用語であるため、それらを取得する方法とその背後にある概念を理解することが重要です。