Veri Bilimi - Regresyon Tablosu: P-Değeri


Regresyon Tablosunda "Katsayılar Bölümü İstatistikleri"

Regresyon Tablosu - Katsayıların İstatistikleri

Şimdi, lineer regresyon fonksiyonundaki katsayıların bağımlı değişken (Calorie_Burnage) üzerinde önemli bir etkisi olup olmadığını test etmek istiyoruz.

Bu, istatistiksel testler kullanarak Ortalama_Nabız ve Kalori_Yanık arasında bir ilişki olduğunu kanıtlamak istediğimiz anlamına gelir.

Katsayıların istatistiklerini açıklayan dört bileşen vardır:

  • std err , Standart Hata anlamına gelir
  • t , katsayıların "t değeridir"
  • P>|t| "P-değeri" olarak adlandırılır
  •  [0.025 0.975] katsayıların güven aralığını temsil eder

Bu modülde "P-değerini" anlamaya odaklanacağız.


P-değeri

P değeri, Ortalama_Nabız ve Kalori_Yanık arasında bir ilişki olup olmadığı sonucuna varılacak istatistiksel bir sayıdır.

Katsayının gerçek değerinin sıfıra eşit olup olmadığını test ederiz (ilişki yok). Bunun için istatistiksel teste Hipotez testi denir.

  • Düşük bir P değeri (< 0.05), katsayının muhtemelen sıfıra eşit olmayacağı anlamına gelir.
  • Yüksek bir P değeri (> 0.05), açıklayıcı değişkenin bağımlı değişkeni etkilediği sonucuna varamayacağımız anlamına gelir (burada: Ortalama_Nabız, Kalori_Yakımı'nı etkiliyorsa).
  • Yüksek bir P-değeri, önemsiz bir P-değeri olarak da adlandırılır.

Hipotez testi

Hipotez testi, sonuçlarınızın geçerli olup olmadığını test etmek için istatistiksel bir prosedürdür.

Örneğimizde, Ortalama_Darbe'nin gerçek katsayısının ve kesmenin sıfıra eşit olup olmadığını test ediyoruz.

Hipotez testinin iki ifadesi vardır. Sıfır hipotezi ve alternatif hipotez.

  • Boş hipotez kısaca H0 olarak yazılabilir.
  • Alternatif hipotez kısaca HA olarak yazılabilir.

Matematiksel olarak yazılmıştır:

H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept = 0
HA: Intercept ≠ 0

≠ işareti "eşit değil" anlamına gelir


Hipotez Testi ve P-değeri

Boş hipotez reddedilebilir veya reddedilebilir.

Sıfır hipotezini reddedersek, bunun Ortalama_Nabız ve Kalori_Yanık arasında bir ilişki olduğu sonucuna varırız. Bu sonuç için P değeri kullanılır.

P değerinin ortak bir eşiği 0,05'tir.

Not: 0,05'lik bir P değeri, zamanların %5'inde boş hipotezi yanlış bir şekilde reddedeceğimiz anlamına gelir. Bu, %5 oranında yanlış bir şekilde bir ilişkiyi sonlandırmış olabileceğimizi kabul ettiğimiz anlamına gelir.

P değeri 0,05'ten küçükse, boş hipotezi reddedebilir ve değişkenler arasında bir ilişki olduğu sonucuna varabiliriz.

Ancak, Ortalama_Nabız'ın P değeri 0.824'tür. Dolayısıyla, Ortalama_Nabız ve Kalori_Burnage arasında bir ilişki kuramayız.

Bu, Ortalama_Nabız'ın gerçek katsayısının sıfır olma olasılığının %82.4 olduğu anlamına gelir.

Kesişme, regresyon fonksiyonunun daha kesin olarak tahmin etme yeteneğini ayarlamak için kullanılır. Bu nedenle, kesmenin P-değerini yorumlamak yaygın değildir.