Pandalar - Veri Çerçevelerini Analiz Etme


Verileri Görüntüleme

DataFrame'e hızlı bir genel bakış elde etmek için en çok kullanılan yöntemlerden biri head()yöntemdir.

Yöntem head(), üstten başlayarak başlıkları ve belirtilen sayıda satırı döndürür.

Örnek

DataFrame'in ilk 10 satırını yazdırarak hızlı bir genel bakış elde edin:

import pandas as pd

df = pd.read_csv('data.csv')

print(df.head(10))

Örneklerimizde 'data.csv' adlı bir CSV dosyası kullanacağız.

data.csv dosyasını indirin veya tarayıcınızda data.csv dosyasını açın.

Not: Satır sayısı belirtilmezse, head()yöntem ilk 5 satırı döndürür.

Örnek

DataFrame'in ilk 5 satırını yazdırın:

import pandas as pd

df = pd.read_csv('data.csv')

print(df.head())

DataFrame'in son satırlarını görüntülemek için de bir tail()yöntem vardır.

Yöntem tail(), alttan başlayarak başlıkları ve belirtilen sayıda satırı döndürür.

Örnek

DataFrame'in son 5 satırını yazdırın:

print(df.tail()) 

w3schools CERTIFIED . 2021

Sertikalı olmak!

Panda modüllerini tamamlayın, alıştırmaları yapın, sınava girin ve w3schools sertifikalı olacaksınız!

$10 KAYIT

Veriler Hakkında Bilgi

info()DataFrames nesnesi , veri kümesi hakkında size daha fazla bilgi veren adlı bir yönteme sahiptir .

Örnek

Verilerle ilgili bilgileri yazdırın:

print(df.info()) 

Sonuç

  <class 'pandas.core.frame.DataFrame'>
  RangeIndex: 169 entries, 0 to 168
  Data columns (total 4 columns):
   #   Column    Non-Null Count  Dtype  
  ---  ------    --------------  -----  
   0   Duration  169 non-null    int64  
   1   Pulse     169 non-null    int64  
   2   Maxpulse  169 non-null    int64  
   3   Calories  164 non-null    float64
  dtypes: float64(1), int64(3)
  memory usage: 5.4 KB
  None
    

Sonuç Açıklaması

Sonuç bize 169 satır ve 4 sütun olduğunu söylüyor:

  RangeIndex: 169 entries, 0 to 168
  Data columns (total 4 columns):

Ve veri türüyle birlikte her sütunun adı:

   #   Column    Non-Null Count  Dtype  
  ---  ------    --------------  -----  
   0   Duration  169 non-null    int64  
   1   Pulse     169 non-null    int64  
   2   Maxpulse  169 non-null    int64  
   3   Calories  164 non-null    float64

Boş Değerler

Yöntem info()ayrıca bize her sütunda kaç tane Boş Olmayan değer olduğunu söyler ve bizim veri setimizde "Kaloriler" sütununda 169 Boş Olmayan değerden 164'ü var gibi görünüyor.

Bu, "Kaloriler" sütununda herhangi bir nedenle hiçbir değeri olmayan 5 satır olduğu anlamına gelir.

Boş değerler veya Null değerler, verileri analiz ederken kötü olabilir ve boş değerlere sahip satırları kaldırmayı düşünmelisiniz. Bu, temizleme verileri denilen şeye doğru bir adımdır ve sonraki bölümlerde bununla ilgili daha fazla bilgi edineceksiniz.