Veri Bilimi - İstatistik Standart Sapma


Standart sapma

Standart sapma, gözlemlerin ne kadar yayıldığını açıklayan bir sayıdır.

Standart sapma

Eğer gözlemler "yayılırsa", matematiksel bir fonksiyon kesin değerleri tahmin etmede güçlük çekecektir. Standart sapma, belirsizliğin bir ölçüsüdür.

Düşük bir standart sapma, sayıların çoğunun ortalama (ortalama) değere yakın olduğu anlamına gelir.

Yüksek standart sapma, değerlerin daha geniş bir aralığa yayıldığı anlamına gelir.

Standart Sapma genellikle Sigma sembolü ile temsil edilir: σ

std()Bir değişkenin standart sapmasını bulmak için Numpy'deki işlevi kullanabiliriz :

Örnek

import numpy as np

std = np.std(full_health_data)
print(std)

Çıktı:

Standart sapma

Bu sayılar ne anlama geliyor?


Varyasyon Katsayısı

Varyasyon katsayısı, standart sapmanın ne kadar büyük olduğu hakkında bir fikir edinmek için kullanılır.

Matematiksel olarak, varyasyon katsayısı şu şekilde tanımlanır:

Coefficient of Variation = Standard Deviation / Mean

 Aşağıdaki kodla devam edersek bunu Python'da yapabiliriz:

Örnek

import numpy as np

cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)

Çıktı:

Varyasyon Katsayısı

Duration, Calorie_Burnage ve Hours_Work değişkenlerinin Max_Pulse, Average_Pulse ve Hours_Sleep ile karşılaştırıldığında yüksek bir Standart Sapmaya sahip olduğunu görüyoruz.