データサイエンス-回帰表:P値


回帰表の「係数部分の統計」

回帰表-係数の統計

ここで、線形回帰関数の係数が従属変数(Calorie_Burnage)に大きな影響を与えるかどうかをテストします。

これは、統計的検定を使用して、Average_PulseとCalorie_Burnageの間に関係が存在することを証明したいことを意味します。

係数の統計を説明する4つのコンポーネントがあります。

  • stderrは標準エラーの略です
  • tは係数の「t値」です
  • P> | t | 「P値」と呼ばれます
  •  [0.025 0.975]は、係数の信頼区間を表します

このモジュールでは、「P値」の理解に焦点を当てます。


P値

P値は、Average_PulseとCalorie_Burnageの間に関係があるかどうかを判断するための統計値です。

係数の真の値がゼロに等しい(関係がない)かどうかをテストします。このための統計的検定は、仮説検定と呼ばれます。

  • 低いP値(<0.05)は、係数がゼロに等しくない可能性が高いことを意味します。
  • 高いP値(> 0.05)は、説明変数が従属変数に影響を与えると結論付けることができないことを意味します(ここでは、Average_PulseがCalorie_Burnageに影響を与える場合)。
  • 高いP値は、重要でないP値とも呼ばれます。

仮説検定

仮説検定は、結果が有効かどうかを検定するための統計的手順です。

この例では、Average_Pulseの真の係数と切片がゼロに等しいかどうかをテストしています。

仮説検定には2つのステートメントがあります。帰無仮説と対立仮説。

  • 帰無仮説は、すぐにH0と書くことができます。
  • 対立仮説は、まもなくHAと書くことができます。

数学的に書かれた:

H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept = 0
HA: Intercept ≠ 0

記号≠は「等しくない」を意味します


仮説検定とP値

帰無仮説は棄却される場合と棄却されない場合があります。

帰無仮説を棄却すると、Average_PulseとCalorie_Burnageの間に関係が存在すると結論付けられます。この結論には、P値が使用されます。

P値の一般的なしきい値は0.05です。

注: 0.05のP値は、5%の確率で、帰無仮説を誤って棄却することを意味します。それは、私たちが5%の確率で、誤って関係を結んだ可能性があることを受け入れることを意味します。

P値が0.05未満の場合、帰無仮説を棄却し、変数間に関係があると結論付けることができます。

ただし、Average_PulseのP値は0.824です。したがって、Average_PulseとCalorie_Burnageの関係を結論付けることはできません。

これは、Average_Pulseの真の係数がゼロである可能性が82.4%あることを意味します。

切片は、より正確に予測する回帰関数の能力を調整するために使用されます。したがって、切片のP値を解釈することはまれです。