Veri Bilimi - İstatistik Korelasyon Matrisi
Korelasyon Matrisi
Bir matris, satırlar ve sütunlar halinde düzenlenmiş bir sayı dizisidir.
Bir korelasyon matrisi, değişkenler arasındaki korelasyon katsayılarını gösteren bir tablodur.
Burada değişkenler ilk satırda ve ilk sütunda temsil edilir:
Yukarıdaki tablo, tam sağlık veri setinden elde edilen verileri kullanmıştır.
gözlemler:
- Duration ve Calorie_Burnage'ın 0.89'luk bir korelasyon katsayısı ile yakından ilişkili olduğunu gözlemliyoruz. Bu, ne kadar uzun süre antrenman yaparsak, o kadar fazla kalori yaktığımız için mantıklıdır.
- Ortalama_Nabız ve Kalori_Burnage arasında neredeyse doğrusal bir ilişki olmadığını gözlemliyoruz (0,02 korelasyon katsayısı)
- Ortalama_Nabız'ın Calorie_Burnage'ı etkilemediği sonucuna varabilir miyiz? Hayır. Bu soruyu cevaplamak için daha sonra geleceğiz!
Python'da Korelasyon Matrisi
corr()
Bir korelasyon matrisi oluşturmak için Python'daki işlevi kullanabiliriz . round()
Çıktıyı iki ondalık basamağa yuvarlamak için işlevi de kullanırız :
Örnek
Corr_Matrix = round(full_health_data.corr(),2)
print(Corr_Matrix)
Çıktı:
Isı Haritası Kullanma
Değişkenler Arasındaki İlişkiyi Görselleştirmek için bir Isı Haritası kullanabiliriz:
Korelasyon katsayısı 1'e ne kadar yakınsa, kareler o kadar yeşil olur.
Korelasyon katsayısı -1'e ne kadar yakınsa, kareler o kadar kahverengi olur.
Bir Isı Haritası Oluşturmak için Seaborn'u kullanın
Bir korelasyon ısı haritası oluşturmak için Seaborn kitaplığını kullanabiliriz (Seaborn, matplotlib tabanlı bir görselleştirme kitaplığıdır):
Örnek
import matplotlib.pyplot as plt
import seaborn as sns
correlation_full_health =
full_health_data.corr()
axis_corr = sns.heatmap(
correlation_full_health,
vmin=-1, vmax=1, center=0,
cmap=sns.diverging_palette(50,
500, n=500),
square=True
)
plt.show()
Örnek Açıklama:
- Seaborn kütüphanesini sns olarak içe aktarın.
- full_health_data setini kullanın.
- Korelasyon matrisini görselleştirmek için bir ısı haritası istediğimizi Python'a söylemek için sns.heatmap() kullanın.
- Korelasyon matrisini kullanın. Isı haritasının maksimum ve minimum değerlerini tanımlayın. 0'ın merkez olduğunu tanımlayın.
- Renkleri sns.diverging_palette ile tanımlayın. n=500, aynı renk paletinde 500 çeşit renk istediğimiz anlamına gelir.
- kare = Doğru, kareleri görmek istediğimiz anlamına gelir.