機械学習
機械学習は、コンピューターにデータと統計の研究から学習させています。
機械学習は、人工知能(AI)の方向への一歩です。
機械学習は、データを分析し、結果を予測することを学習するプログラムです。
どこから始めれば?
このチュートリアルでは、数学と研究統計、およびデータセットに基づいて重要な数値を計算する方法に戻ります。
また、さまざまなPythonモジュールを使用して必要な答えを得る方法も学びます。
そして、学んだことに基づいて結果を予測できる関数の作り方を学びます。
データセット
コンピューターの頭の中では、データセットはデータのコレクションです。配列から完全なデータベースまで、何でもかまいません。
配列の例:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
データベースの例:
カーネーム | 色 | 年 | スピード | オートパス |
BMW | 赤 | 5 | 99 | Y |
ボルボ | ブラック | 7 | 86 | Y |
VW | グレー | 8 | 87 | N |
VW | 白い | 7 | 88 | Y |
フォード | 白い | 2 | 111 | Y |
VW | 白い | 17 | 86 | Y |
テスラ | 赤 | 2 | 103 | Y |
BMW | ブラック | 9 | 87 | Y |
ボルボ | グレー | 4 | 94 | N |
フォード | 白い | 11 | 78 | N |
トヨタ | グレー | 12 | 77 | N |
VW | 白い | 9 | 85 | N |
トヨタ | 青い | 6 | 86 | Y |
配列を見ると、平均値はおそらく80または90前後であると推測でき、最高値と最低値を決定することもできますが、他に何ができるでしょうか。
データベースを見ると、最も人気のある色は白で、最も古い車は17年であることがわかりますが、他の値を見るだけで、車にAutoPassがあるかどうかを予測できるとしたらどうでしょうか。
それが機械学習の目的です!データを分析し、結果を予測します!
機械学習では、非常に大きなデータセットを使用するのが一般的です。このチュートリアルでは、機械学習のさまざまな概念をできるだけ簡単に理解できるようにし、理解しやすい小さなデータセットを使用します。
データ型
データを分析するには、どのような種類のデータを扱っているかを知ることが重要です。
データ型は、次の3つの主要なカテゴリに分類できます。
- 数値
- カテゴリカル
- 序数
数値データは数値であり、次の2つの数値カテゴリに分割できます。
- 離散データ
-整数に制限されている数値。例:通過する車の数。 - 連続データ
-無限の価値を持つ数値。例:アイテムの価格、またはアイテムのサイズ
カテゴリデータは、相互に測定できない値です。例:色の値、または任意のyes / no値。
順序データはカテゴリデータに似ていますが、相互に測定することができます。例:AがBよりも優れている学校の成績など。
データソースのデータ型を知ることにより、それらを分析するときに使用する手法を知ることができます。
次の章では、統計とデータの分析について詳しく学習します。