Veri Bilimi - İstatistik Korelasyon Matrisi


Korelasyon Matrisi

Bir matris, satırlar ve sütunlar halinde düzenlenmiş bir sayı dizisidir.

Bir korelasyon matrisi, değişkenler arasındaki korelasyon katsayılarını gösteren bir tablodur.

Burada değişkenler ilk satırda ve ilk sütunda temsil edilir:

Korelasyon Matrisi

Yukarıdaki tablo, tam sağlık veri setinden elde edilen verileri kullanmıştır.

gözlemler:

  • Duration ve Calorie_Burnage'ın 0.89'luk bir korelasyon katsayısı ile yakından ilişkili olduğunu gözlemliyoruz. Bu, ne kadar uzun süre antrenman yaparsak, o kadar fazla kalori yaktığımız için mantıklıdır.
  • Ortalama_Nabız ve Kalori_Burnage arasında neredeyse doğrusal bir ilişki olmadığını gözlemliyoruz (0,02 korelasyon katsayısı)
  • Ortalama_Nabız'ın Calorie_Burnage'ı etkilemediği sonucuna varabilir miyiz? Hayır. Bu soruyu cevaplamak için daha sonra geleceğiz!

Python'da Korelasyon Matrisi

corr()Bir korelasyon matrisi oluşturmak için Python'daki işlevi kullanabiliriz . round()Çıktıyı iki ondalık basamağa yuvarlamak için işlevi de kullanırız :

Örnek

Corr_Matrix = round(full_health_data.corr(),2)
print(Corr_Matrix)

Çıktı:

Korelasyon Matrisi

Isı Haritası Kullanma

Değişkenler Arasındaki İlişkiyi Görselleştirmek için bir Isı Haritası kullanabiliriz:

Korelasyon Isı Haritası

Korelasyon katsayısı 1'e ne kadar yakınsa, kareler o kadar yeşil olur.

Korelasyon katsayısı -1'e ne kadar yakınsa, kareler o kadar kahverengi olur.


Bir Isı Haritası Oluşturmak için Seaborn'u kullanın

Bir korelasyon ısı haritası oluşturmak için Seaborn kitaplığını kullanabiliriz (Seaborn, matplotlib tabanlı bir görselleştirme kitaplığıdır):

Örnek

import matplotlib.pyplot as plt
import seaborn as sns

correlation_full_health = full_health_data.corr()

axis_corr = sns.heatmap(
correlation_full_health,
vmin=-1, vmax=1, center=0,
cmap=sns.diverging_palette(50, 500, n=500),
square=True
)

plt.show()

Örnek Açıklama:

  • Seaborn kütüphanesini sns olarak içe aktarın.
  • full_health_data setini kullanın.
  • Korelasyon matrisini görselleştirmek için bir ısı haritası istediğimizi Python'a söylemek için sns.heatmap() kullanın.
  • Korelasyon matrisini kullanın. Isı haritasının maksimum ve minimum değerlerini tanımlayın. 0'ın merkez olduğunu tanımlayın.
  • Renkleri sns.diverging_palette ile tanımlayın. n=500, aynı renk paletinde 500 çeşit renk istediğimiz anlamına gelir.
  • kare = Doğru, kareleri görmek istediğimiz anlamına gelir.