Veri Bilimi - İstatistiklere Giriş
İstatistiğe Giriş
İstatistik, verileri analiz etme bilimidir.
Tahmin için bir model oluşturduğumuzda, tahminin güvenilirliğini değerlendirmeliyiz.
Sonuçta, ona güvenemezsek, bir tahminin değeri nedir?
Tanımlayıcı istatistikler
İlk önce bazı temel tanımlayıcı istatistikleri ele alacağız.
Tanımlayıcı istatistikler, bir veri kümesinin aşağıdaki gibi önemli özelliklerini özetler:
- Saymak
- toplam
- Standart sapma
- Yüzdelik
- Ortalama
- Vb..
Verilere aşina olmak için iyi bir başlangıç noktasıdır.
describe()
Verileri özetlemek için Python'daki işlevi kullanabiliriz :
Örnek
print (full_health_data.describe())
Çıktı:
Burada ilginç bir şey görüyor musun?