Veri Bilimi - İstatistik Standart Sapma
Standart sapma
Standart sapma, gözlemlerin ne kadar yayıldığını açıklayan bir sayıdır.
Eğer gözlemler "yayılırsa", matematiksel bir fonksiyon kesin değerleri tahmin etmede güçlük çekecektir. Standart sapma, belirsizliğin bir ölçüsüdür.
Düşük bir standart sapma, sayıların çoğunun ortalama (ortalama) değere yakın olduğu anlamına gelir.
Yüksek standart sapma, değerlerin daha geniş bir aralığa yayıldığı anlamına gelir.
Standart Sapma genellikle Sigma sembolü ile temsil edilir: σ
std()
Bir değişkenin standart sapmasını bulmak için Numpy'deki işlevi kullanabiliriz :
Örnek
import numpy as np
std = np.std(full_health_data)
print(std)
Çıktı:
Bu sayılar ne anlama geliyor?
Varyasyon Katsayısı
Varyasyon katsayısı, standart sapmanın ne kadar büyük olduğu hakkında bir fikir edinmek için kullanılır.
Matematiksel olarak, varyasyon katsayısı şu şekilde tanımlanır:
Coefficient of Variation = Standard Deviation / Mean
Aşağıdaki kodla devam edersek bunu Python'da yapabiliriz:
Örnek
import numpy as np
cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)
Çıktı:
Duration, Calorie_Burnage ve Hours_Work değişkenlerinin Max_Pulse, Average_Pulse ve Hours_Sleep ile karşılaştırıldığında yüksek bir Standart Sapmaya sahip olduğunu görüyoruz.