Pandalar - Veri Çerçevelerini Analiz Etme
Verileri Görüntüleme
DataFrame'e hızlı bir genel bakış elde etmek için en çok kullanılan yöntemlerden biri head()
yöntemdir.
Yöntem head()
, üstten başlayarak başlıkları ve belirtilen sayıda satırı döndürür.
Örnek
DataFrame'in ilk 10 satırını yazdırarak hızlı bir genel bakış elde edin:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head(10))
Örneklerimizde 'data.csv' adlı bir CSV dosyası kullanacağız.
data.csv dosyasını indirin veya tarayıcınızda data.csv dosyasını açın.
Not: Satır sayısı belirtilmezse, head()
yöntem ilk 5 satırı döndürür.
Örnek
DataFrame'in ilk 5 satırını yazdırın:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head())
DataFrame'in son satırlarını görüntülemek için de bir tail()
yöntem
vardır.
Yöntem tail()
, alttan başlayarak başlıkları ve belirtilen sayıda satırı döndürür.
Örnek
DataFrame'in son 5 satırını yazdırın:
print(df.tail())
Sertikalı olmak!
$10 KAYIT
Veriler Hakkında Bilgi
info()
DataFrames nesnesi , veri kümesi hakkında size daha fazla bilgi veren adlı bir yönteme sahiptir .
Örnek
Verilerle ilgili bilgileri yazdırın:
print(df.info())
Sonuç
<class 'pandas.core.frame.DataFrame'> RangeIndex: 169 entries, 0 to 168 Data columns (total 4 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Duration 169 non-null int64 1 Pulse 169 non-null int64 2 Maxpulse 169 non-null int64 3 Calories 164 non-null float64 dtypes: float64(1), int64(3) memory usage: 5.4 KB None
Sonuç Açıklaması
Sonuç bize 169 satır ve 4 sütun olduğunu söylüyor:
RangeIndex: 169 entries, 0 to 168 Data columns (total 4 columns):
Ve veri türüyle birlikte her sütunun adı:
# Column Non-Null Count Dtype --- ------ -------------- ----- 0 Duration 169 non-null int64 1 Pulse 169 non-null int64 2 Maxpulse 169 non-null int64 3 Calories 164 non-null float64
Boş Değerler
Yöntem info()
ayrıca bize her sütunda kaç tane Boş Olmayan değer olduğunu söyler ve bizim veri setimizde "Kaloriler" sütununda 169 Boş Olmayan değerden 164'ü var gibi görünüyor.
Bu, "Kaloriler" sütununda herhangi bir nedenle hiçbir değeri olmayan 5 satır olduğu anlamına gelir.
Boş değerler veya Null değerler, verileri analiz ederken kötü olabilir ve boş değerlere sahip satırları kaldırmayı düşünmelisiniz. Bu, temizleme verileri denilen şeye doğru bir adımdır ve sonraki bölümlerde bununla ilgili daha fazla bilgi edineceksiniz.