Pythonチュートリアル

Pythonホーム Pythonイントロ Pythonはじめに Python構文 Pythonコメント Python変数 Pythonデータ型 Python番号 Pythonキャスティング Python文字列 Pythonブール値 Python演算子 Pythonリスト Pythonタプル Pythonセット Python辞書 Python If ... Else PythonのWhileループ PythonForループ Python関数 Python Lambda Python配列 Pythonクラス/オブジェクト Pythonの継承 Pythonイテレータ Pythonスコープ Pythonモジュール Pythonの日付 Python数学 Python JSON Python RegEx Python PIP Python試してみてください... Pythonユーザー入力 Python文字列フォーマット

ファイル処理

Pythonファイル処理 Python読み取りファイル Python書き込み/ファイルの作成 Pythonファイルの削除

Pythonモジュール

NumPyチュートリアル パンダ攻略 Scipyチュートリアル

Python Matplotlib

Matplotlibイントロ Matplotlibはじめに Matplotlib Pyplot Matplotlibプロット Matplotlibマーカー Matplotlibライン Matplotlibラベル Matplotlibグリッド Matplotlibサブプロット Matplotlib散布図 Matplotlibバー Matplotlibヒストグラム Matplotlib円グラフ

機械学習

入門 平均中央値モード 標準偏差 パーセンタイル データ配信 正規データ分布 散布図 線形回帰 多項式回帰 重回帰 規模 トレーニング/テスト デシジョンツリー

Python MySQL

MySQLはじめに MySQLデータベースの作成 MySQLテーブルの作成 MySQL挿入 MySQL Select MySQL Where MySQL Order By MySQL削除 MySQLドロップテーブル MySQLアップデート MySQLの制限 MySQL参加

Python MongoDB

MongoDBはじめに MongoDBデータベースの作成 MongoDBCreateコレクション MongoDBインサート MongoDB検索 MongoDBクエリ MongoDBソート MongoDB削除 MongoDBドロップコレクション MongoDBアップデート MongoDBの制限

Pythonリファレンス

Pythonの概要 Python組み込み関数 Python文字列メソッド Pythonリストメソッド Python辞書メソッド Pythonタプルメソッド Pythonセットメソッド Pythonファイルメソッド Pythonキーワード Pythonの例外 Python用語集

モジュールリファレンス

ランダムモジュール リクエストモジュール 統計モジュール 数学モジュール cMathモジュール

Pythonハウツー

リストの重複を削除する 文字列を逆にする 2つの数字を追加する

Pythonの例

Pythonの例 Pythonコンパイラ Python演習 Pythonクイズ Python証明書

機械学習

機械学習は、コンピューターにデータと統計の研究から学習させています。

機械学習は、人工知能(AI)の方向への一歩です。

機械学習は、データを分析し、結果を予測することを学習するプログラムです。

どこから始めれば?

このチュートリアルでは、数学と研究統計、およびデータセットに基づいて重要な数値を計算する方法に戻ります。

また、さまざまなPythonモジュールを使用して必要な答えを得る方法も学びます。

そして、学んだことに基づいて結果を予測できる関数の作り方を学びます。


データセット

コンピューターの頭の中では、データセットはデータのコレクションです。配列から完全なデータベースまで、何でもかまいません。

配列の例:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

データベースの例:

カーネームスピードオートパス
BMW599Y
ボルボブラック786Y
VWグレー887N
VW白い788Y
フォード白い2111Y
VW白い1786Y
テスラ2103Y
BMWブラック987Y
ボルボグレー494N
フォード白い1178N
トヨタグレー1277N
VW白い985N
トヨタ青い686Y

配列を見ると、平均値はおそらく80または90前後であると推測でき、最高値と最低値を決定することもできますが、他に何ができるでしょうか。

データベースを見ると、最も人気のある色は白で、最も古い車は17年であることがわかりますが、他の値を見るだけで、車にAutoPassがあるかどうかを予測できるとしたらどうでしょうか。

それが機械学習の目的です!データを分析し、結果を予測します!

機械学習では、非常に大きなデータセットを使用するのが一般的です。このチュートリアルでは、機械学習のさまざまな概念をできるだけ簡単に理解できるようにし、理解しやすい小さなデータセットを使用します。


データ型

データを分析するには、どのような種類のデータを扱っているかを知ることが重要です。

データ型は、次の3つの主要なカテゴリに分類できます。

  • 数値
  • カテゴリカル
  • 序数

数値データは数値であり、次の2つの数値カテゴリに分割できます。

  • 離散データ
    -整数に制限されている数値。例:通過する車の数。
  • 連続データ
    -無限の価値を持つ数値。例:アイテムの価格、またはアイテムのサイズ

カテゴリデータは、相互に測定できない値です。例:色の値、または任意のyes / no値。

順序データはカテゴリデータに似ていますが、相互に測定することができます。例:AがBよりも優れている学校の成績など。

データソースのデータ型を知ることにより、それらを分析するときに使用する手法を知ることができます。

次の章では、統計とデータの分析について詳しく学習します。