データサイエンス-統計入門


統計入門

統計はデータを分析する科学です。

予測のモデルを作成したら、予測の信頼性を評価する必要があります。

結局のところ、私たちがそれに頼ることができない場合、予測の価値は何ですか?


記述統計

まず、いくつかの基本的な記述統計について説明します。

記述統計は、次のようなデータセットの重要な機能を要約したものです。

  • カウント
  • 標準偏差
  • パーセンタイル
  • 平均
  • 等..

データに精通するための良い出発点です。

Pythonの関数を使用してdescribe()、データを要約できます。

print (full_health_data.describe())

出力:

統計説明

ここで何か面白いものがありますか?