Pythonチュートリアル

Pythonホーム Pythonイントロ Pythonはじめに Python構文 Pythonコメント Python変数 Pythonデータ型 Python番号 Pythonキャスティング Python文字列 Pythonブール値 Python演算子 Pythonリスト Pythonタプル Pythonセット Python辞書 Python If ... Else PythonのWhileループ PythonForループ Python関数 Python Lambda Python配列 Pythonクラス/オブジェクト Pythonの継承 Pythonイテレータ Pythonスコープ Pythonモジュール Pythonの日付 Python数学 Python JSON Python RegEx Python PIP Python試してみてください... Pythonユーザー入力 Python文字列フォーマット

ファイル処理

Pythonファイル処理 Python読み取りファイル Python書き込み/ファイルの作成 Pythonファイルの削除

Pythonモジュール

NumPyチュートリアル パンダ攻略 Scipyチュートリアル

Python Matplotlib

Matplotlibイントロ Matplotlibはじめに Matplotlib Pyplot Matplotlibプロット Matplotlibマーカー Matplotlibライン Matplotlibラベル Matplotlibグリッド Matplotlibサブプロット Matplotlib散布図 Matplotlibバー Matplotlibヒストグラム Matplotlib円グラフ

機械学習

入門 平均中央値モード 標準偏差 パーセンタイル データ配信 正規データ分布 散布図 線形回帰 多項式回帰 重回帰 規模 トレーニング/テスト デシジョンツリー

Python MySQL

MySQLはじめに MySQLデータベースの作成 MySQLテーブルの作成 MySQL挿入 MySQL Select MySQL Where MySQL Order By MySQL削除 MySQLドロップテーブル MySQLアップデート MySQLの制限 MySQL参加

Python MongoDB

MongoDBはじめに MongoDBデータベースの作成 MongoDBCreateコレクション MongoDBインサート MongoDB検索 MongoDBクエリ MongoDBソート MongoDB削除 MongoDBドロップコレクション MongoDBアップデート MongoDBの制限

Pythonリファレンス

Pythonの概要 Python組み込み関数 Python文字列メソッド Pythonリストメソッド Python辞書メソッド Pythonタプルメソッド Pythonセットメソッド Pythonファイルメソッド Pythonキーワード Pythonの例外 Python用語集

モジュールリファレンス

ランダムモジュール リクエストモジュール 統計モジュール 数学モジュール cMathモジュール

Pythonハウツー

リストの重複を削除する 文字列を逆にする 2つの数字を追加する

Pythonの例

Pythonの例 Pythonコンパイラ Python演習 Pythonクイズ Python証明書

機械学習-データ配信


データ配信

このチュートリアルの前半では、さまざまな概念を理解するために、例で非常に少量のデータを使用しました。

現実の世界では、データセットははるかに大きくなりますが、少なくともプロジェクトの初期段階では、現実のデータを収集するのは難しい場合があります。

ビッグデータセットを取得するにはどうすればよいですか?

テスト用のビッグデータセットを作成するには、PythonモジュールNumPyを使用します。このモジュールには、任意のサイズのランダムデータセットを作成するためのさまざまなメソッドが付属しています。

0から5までの250のランダムフロートを含む配列を作成します。

import numpy

x = numpy.random.uniform(0.0, 5.0, 250)

print(x)

ヒストグラム

データセットを視覚化するために、収集したデータを使用してヒストグラムを描画できます。

PythonモジュールMatplotlibを使用してヒストグラムを描画します。

MatplotlibチュートリアルでMatplotlibモジュールについて学びます

ヒストグラムを描く:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 250)

plt.hist(x, 5)
plt.show()

結果:

ヒストグラムの説明

上記の例の配列を使用して、5本の棒でヒストグラムを描画します。

最初のバーは、配列内の0から1までの値の数を表します。

2番目のバーは、1から2までの値の数を表します。

等。

これにより、この結果が得られます。

  • 52の値は0から1の間です
  • 48の値は1から2の間です
  • 49の値は2から3の間です
  • 51の値は3から4の間です
  • 50の値は4から5の間です

注:配列値は乱数であり、コンピューターでまったく同じ結果を表示することはありません。

ビッグデータの配布

250個の値を含む配列はそれほど大きなものとは見なされませんが、ランダムな値のセットを作成する方法がわかったので、パラメーターを変更することで、必要なだけ大きなデータセットを作成できます。

100000の乱数を含む配列を作成し、100本の棒のヒストグラムを使用してそれらを表示します。

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 100000)

plt.hist(x, 100)
plt.show()