Pythonチュートリアル

Pythonホーム Pythonイントロ Pythonはじめに Python構文 Pythonコメント Python変数 Pythonデータ型 Python番号 Pythonキャスティング Python文字列 Pythonブール値 Python演算子 Pythonリスト Pythonタプル Pythonセット Python辞書 Python If ... Else PythonのWhileループ PythonForループ Python関数 Python Lambda Python配列 Pythonクラス/オブジェクト Pythonの継承 Pythonイテレータ Pythonスコープ Pythonモジュール Pythonの日付 Python数学 Python JSON Python RegEx Python PIP Python試してみてください... Pythonユーザー入力 Python文字列フォーマット

ファイル処理

Pythonファイル処理 Python読み取りファイル Python書き込み/ファイルの作成 Pythonファイルの削除

Pythonモジュール

NumPyチュートリアル パンダ攻略 Scipyチュートリアル

Python Matplotlib

Matplotlibイントロ Matplotlibはじめに Matplotlib Pyplot Matplotlibプロット Matplotlibマーカー Matplotlibライン Matplotlibラベル Matplotlibグリッド Matplotlibサブプロット Matplotlib散布図 Matplotlibバー Matplotlibヒストグラム Matplotlib円グラフ

機械学習

入門 平均中央値モード 標準偏差 パーセンタイル データ配信 正規データ分布 散布図 線形回帰 多項式回帰 重回帰 規模 トレーニング/テスト デシジョンツリー

Python MySQL

MySQLはじめに MySQLデータベースの作成 MySQLテーブルの作成 MySQL挿入 MySQL Select MySQL Where MySQL Order By MySQL削除 MySQLドロップテーブル MySQLアップデート MySQLの制限 MySQL参加

Python MongoDB

MongoDBはじめに MongoDBデータベースの作成 MongoDBCreateコレクション MongoDBインサート MongoDB検索 MongoDBクエリ MongoDBソート MongoDB削除 MongoDBドロップコレクション MongoDBアップデート MongoDBの制限

Pythonリファレンス

Pythonの概要 Python組み込み関数 Python文字列メソッド Pythonリストメソッド Python辞書メソッド Pythonタプルメソッド Pythonセットメソッド Pythonファイルメソッド Pythonキーワード Pythonの例外 Python用語集

モジュールリファレンス

ランダムモジュール リクエストモジュール 統計モジュール 数学モジュール cMathモジュール

Pythonハウツー

リストの重複を削除する 文字列を逆にする 2つの数字を追加する

Pythonの例

Pythonの例 Pythonコンパイラ Python演習 Pythonクイズ Python証明書

機械学習-散布図


散布図

散布図は、データセットの各値がドットで表されている図です。

Matplotlibモジュールには、散布図を描画するためのメソッドがあり、同じ長さの2つの配列が必要です。1つはx軸の値用で、もう1つはy軸の値用です。

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]

y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

x配列は、各車の年齢を表します

y配列は、各車の速度を表します

この方法を使用してscatter()、散布図を描画します。

import matplotlib.pyplot as plt

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

plt.scatter(x, y)
plt.show()

結果:

散布図の説明

x軸は年齢を表し、y軸は速度を表します。

図からわかるのは、最も速い2台の車は両方とも2年前であり、最も遅い車は12年前であったということです。

注:車が新しいほど速く運転できるようですが、それは偶然かもしれません。結局、登録した車は13台だけでした。



ランダムなデータ分布

機械学習では、データセットに数千、さらには数百万の値を含めることができます。

アルゴリズムをテストしているときは、実際のデータがない可能性があります。ランダムに生成された値を使用する必要がある場合があります。

前の章で学んだように、NumPyモジュールはそれを助けることができます!

正規データ分布からの1000個の乱数で満たされた2つの配列を作成しましょう。

最初の配列の平均は5.0に設定され、標準偏差は1.0になります。

2番目の配列の平均は10.0に設定され、標準偏差は2.0になります。

1000ドットの散布図:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)
plt.show()

結果:

散布図の説明

ドットがx軸の値5とy軸の値10の周りに集中していることがわかります。

また、x軸よりもy軸の方が広がりが広いことがわかります。