Veri Bilimi - Regresyon Tablosu: R-Kare
R - Kare
R-Squared ve Düzeltilmiş R-Squared, lineer regresyon modelinin veri noktalarına ne kadar iyi uyduğunu açıklar:
R-Kare değeri her zaman 0 ila 1 arasındadır (%0 ila %100).
- Yüksek bir R-Kare değeri, birçok veri noktasının doğrusal regresyon fonksiyon çizgisine yakın olduğu anlamına gelir.
- Düşük bir R-Kare değeri, doğrusal regresyon fonksiyon çizgisinin verilere iyi uymadığı anlamına gelir.
Düşük R - Kare Değerinin Görsel Örneği (0.00)
Regresyon modelimiz, R-Kare sıfır değerini gösterir; bu, doğrusal regresyon fonksiyon çizgisinin verilere iyi uymadığı anlamına gelir.
Bu, Ortalama_Pulse ve Kalori_Burnage veri noktaları aracılığıyla doğrusal regresyon fonksiyonunu çizdiğimizde görselleştirilebilir.
Yüksek R - Kare Değerinin Görsel Örneği (0,79)
Ancak, Duration ve Calorie_Burnage'ı çizersek , R-Kare artar. Burada veri noktalarının lineer regresyon fonksiyon çizgisine yakın olduğunu görüyoruz:
İşte Python'daki kod:
Örnek
import pandas as pd
import matplotlib.pyplot as plt
from scipy
import stats
full_health_data = pd.read_csv("data.csv", header=0, sep=",")
x = full_health_data["Duration"]
y =
full_health_data ["Calorie_Burnage"]
slope, intercept, r, p, std_err =
stats.linregress(x, y)
def myfunc(x):
return slope * x + intercept
mymodel = list(map(myfunc, x))
print(mymodel)
plt.scatter(x,
y)
plt.plot(x, mymodel)
plt.ylim(ymin=0, ymax=2000)
plt.xlim(xmin=0,
xmax=200)
plt.xlabel("Duration")
plt.ylabel ("Calorie_Burnage")
plt.show()
Özet - Average_Pulse ile Calorie_Burnage'ı Tahmin Etme
Açıklayıcı değişken olarak Ortalama_Pulse ile doğrusal regresyon fonksiyonunu nasıl özetleyebiliriz?
- 0.3296 katsayısı, yani Ortalama_Nabız'ın Kalori_Burnage üzerinde çok küçük bir etkisi vardır.
- Yüksek P-değeri (0.824), yani Ortalama_Nabız ve Kalori_Yanık arasında bir ilişki kuramayacağımız anlamına gelir.
- R-Kare değeri 0, bu, doğrusal regresyon fonksiyon çizgisinin verilere iyi uymadığı anlamına gelir.