データサイエンス-統計入門
統計入門
統計はデータを分析する科学です。
予測のモデルを作成したら、予測の信頼性を評価する必要があります。
結局のところ、私たちがそれに頼ることができない場合、予測の価値は何ですか?
記述統計
まず、いくつかの基本的な記述統計について説明します。
記述統計は、次のようなデータセットの重要な機能を要約したものです。
- カウント
- 和
- 標準偏差
- パーセンタイル
- 平均
- 等..
データに精通するための良い出発点です。
Pythonの関数を使用してdescribe()
、データを要約できます。
例
print (full_health_data.describe())
出力:
ここで何か面白いものがありますか?