Pythonチュートリアル

Pythonホーム Pythonイントロ Pythonはじめに Python構文 Pythonコメント Python変数 Pythonデータ型 Python番号 Pythonキャスティング Python文字列 Pythonブール値 Python演算子 Pythonリスト Pythonタプル Pythonセット Python辞書 Python If ... Else PythonのWhileループ PythonForループ Python関数 Python Lambda Python配列 Pythonクラス/オブジェクト Pythonの継承 Pythonイテレータ Pythonスコープ Pythonモジュール Pythonの日付 Python数学 Python JSON Python RegEx Python PIP Python試してみてください... Pythonユーザー入力 Python文字列フォーマット

ファイル処理

Pythonファイル処理 Python読み取りファイル Python書き込み/ファイルの作成 Pythonファイルの削除

Pythonモジュール

NumPyチュートリアル パンダ攻略 Scipyチュートリアル

Python Matplotlib

Matplotlibイントロ Matplotlibはじめに Matplotlib Pyplot Matplotlibプロット Matplotlibマーカー Matplotlibライン Matplotlibラベル Matplotlibグリッド Matplotlibサブプロット Matplotlib散布図 Matplotlibバー Matplotlibヒストグラム Matplotlib円グラフ

機械学習

入門 平均中央値モード 標準偏差 パーセンタイル データ配信 正規データ分布 散布図 線形回帰 多項式回帰 重回帰 規模 トレーニング/テスト デシジョンツリー

Python MySQL

MySQLはじめに MySQLデータベースの作成 MySQLテーブルの作成 MySQL挿入 MySQL Select MySQL Where MySQL Order By MySQL削除 MySQLドロップテーブル MySQLアップデート MySQLの制限 MySQL参加

Python MongoDB

MongoDBはじめに MongoDBデータベースの作成 MongoDBCreateコレクション MongoDBインサート MongoDB検索 MongoDBクエリ MongoDBソート MongoDB削除 MongoDBドロップコレクション MongoDBアップデート MongoDBの制限

Pythonリファレンス

Pythonの概要 Python組み込み関数 Python文字列メソッド Pythonリストメソッド Python辞書メソッド Pythonタプルメソッド Pythonセットメソッド Pythonファイルメソッド Pythonキーワード Pythonの例外 Python用語集

モジュールリファレンス

ランダムモジュール リクエストモジュール 統計モジュール 数学モジュール cMathモジュール

Pythonハウツー

リストの重複を削除する 文字列を逆にする 2つの数字を追加する

Pythonの例

Pythonの例 Pythonコンパイラ Python演習 Pythonクイズ Python証明書

機械学習-平均中央値モード


平均、中央値、最頻値

数字のグループを見ることから何を学ぶことができますか?

機械学習(および数学)では、多くの場合、私たちが興味を持っている3つの価値観があります。

  • 平均-平均値
  • 中央値-中点値
  • モード-最も一般的な値

例:13台の車の速度を登録しました:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

平均、中間、または最も一般的な速度値は何ですか?


平均

平均値は平均値です。

平均を計算するには、すべての値の合計を見つけ、その合計を値の数で割ります。

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

NumPyモジュールにはこのためのメソッドがあります。NumPyチュートリアルでNumPyモジュールについて学びます

NumPymean()メソッドを使用して、平均速度を見つけます。

import numpy

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

x = numpy.mean(speed)

print(x)


中央値

中央値は、すべての値を並べ替えた後の中央の値です。

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

中央値を見つける前に、数値を並べ替えることが重要です。

NumPyモジュールにはこのためのメソッドがあります:

NumPymedian()メソッドを使用して、中間値を見つけます。

import numpy

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

x = numpy.median(speed)

print(x)

中央に2つの数値がある場合は、それらの数値の合計を2で割ります。

77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103

(86 + 87) / 2 =
86.5

NumPyモジュールの使用:

import numpy

speed = [99,86,87,88,86,103,87,94,78,77,85,86]

x = numpy.median(speed)

print(x)

モード

モード値は、最も多く表示される値です。

99,86, 87, 88, 111,86, 103, 87, 94, 78, 77, 85,86 = 86

SciPyモジュールにはこのためのメソッドがあります。SciPyチュートリアルでSciPyモジュールについて学びます

SciPymode()メソッドを使用して、最も多く表示される番号を見つけます。

from scipy import stats

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

x = stats.mode(speed)

print(x)

章のまとめ

平均、中央値、最頻値は機械学習でよく使用される手法であるため、その背後にある概念を理解することが重要です。