Veri Bilimi - Regresyon Tablosu: P-Değeri
Regresyon Tablosunda "Katsayılar Bölümü İstatistikleri"
Şimdi, lineer regresyon fonksiyonundaki katsayıların bağımlı değişken (Calorie_Burnage) üzerinde önemli bir etkisi olup olmadığını test etmek istiyoruz.
Bu, istatistiksel testler kullanarak Ortalama_Nabız ve Kalori_Yanık arasında bir ilişki olduğunu kanıtlamak istediğimiz anlamına gelir.
Katsayıların istatistiklerini açıklayan dört bileşen vardır:
- std err , Standart Hata anlamına gelir
- t , katsayıların "t değeridir"
- P>|t| "P-değeri" olarak adlandırılır
- [0.025 0.975] katsayıların güven aralığını temsil eder
Bu modülde "P-değerini" anlamaya odaklanacağız.
P-değeri
P değeri, Ortalama_Nabız ve Kalori_Yanık arasında bir ilişki olup olmadığı sonucuna varılacak istatistiksel bir sayıdır.
Katsayının gerçek değerinin sıfıra eşit olup olmadığını test ederiz (ilişki yok). Bunun için istatistiksel teste Hipotez testi denir.
- Düşük bir P değeri (< 0.05), katsayının muhtemelen sıfıra eşit olmayacağı anlamına gelir.
- Yüksek bir P değeri (> 0.05), açıklayıcı değişkenin bağımlı değişkeni etkilediği sonucuna varamayacağımız anlamına gelir (burada: Ortalama_Nabız, Kalori_Yakımı'nı etkiliyorsa).
- Yüksek bir P-değeri, önemsiz bir P-değeri olarak da adlandırılır.
Hipotez testi
Hipotez testi, sonuçlarınızın geçerli olup olmadığını test etmek için istatistiksel bir prosedürdür.
Örneğimizde, Ortalama_Darbe'nin gerçek katsayısının ve kesmenin sıfıra eşit olup olmadığını test ediyoruz.
Hipotez testinin iki ifadesi vardır. Sıfır hipotezi ve alternatif hipotez.
- Boş hipotez kısaca H0 olarak yazılabilir.
- Alternatif hipotez kısaca HA olarak yazılabilir.
Matematiksel olarak yazılmıştır:
H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept =
0
HA: Intercept ≠ 0
≠ işareti "eşit değil" anlamına gelir
Hipotez Testi ve P-değeri
Boş hipotez reddedilebilir veya reddedilebilir.
Sıfır hipotezini reddedersek, bunun Ortalama_Nabız ve Kalori_Yanık arasında bir ilişki olduğu sonucuna varırız. Bu sonuç için P değeri kullanılır.
P değerinin ortak bir eşiği 0,05'tir.
Not: 0,05'lik bir P değeri, zamanların %5'inde boş hipotezi yanlış bir şekilde reddedeceğimiz anlamına gelir. Bu, %5 oranında yanlış bir şekilde bir ilişkiyi sonlandırmış olabileceğimizi kabul ettiğimiz anlamına gelir.
P değeri 0,05'ten küçükse, boş hipotezi reddedebilir ve değişkenler arasında bir ilişki olduğu sonucuna varabiliriz.
Ancak, Ortalama_Nabız'ın P değeri 0.824'tür. Dolayısıyla, Ortalama_Nabız ve Kalori_Burnage arasında bir ilişki kuramayız.
Bu, Ortalama_Nabız'ın gerçek katsayısının sıfır olma olasılığının %82.4 olduğu anlamına gelir.
Kesişme, regresyon fonksiyonunun daha kesin olarak tahmin etme yeteneğini ayarlamak için kullanılır. Bu nedenle, kesmenin P-değerini yorumlamak yaygın değildir.