Veri Bilimi - Python DataFrame


Pandalarla DataFrame Oluşturun

Veri çerçevesi, verilerin yapılandırılmış bir temsilidir.

Kurgusal sayılarla 3 sütun ve 5 satırdan oluşan bir veri çerçevesi tanımlayalım:

Örnek

import pandas as pd

d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9, 5], 'col3': [7, 8, 12, 1, 11]}

df = pd.DataFrame(data=d)

print(df)

Örnek Açıklama

  • Pandalar kitaplığını pd olarak içe aktarın
  • d adlı bir değişkende sütun ve satırlarla verileri tanımlayın
  • pd.DataFrame() işlevini kullanarak bir veri çerçevesi oluşturun
  • Veri çerçevesi 3 sütun ve 5 satır içerir
  • print() işleviyle veri çerçevesi çıktısını yazdırın

pd yazıyoruz . Python'un Pandas kitaplığından DataFrame() işlevini etkinleştirmek istediğimizi bilmesini sağlamak için DataFrame() ' in önünde .

DataFrame'de büyük D ve F harflerinin farkında olun!


Çıktının Yorumlanması

Bu çıktı:

Veri Çerçevesi Çıkışı

Sütunların adlarının "sütun1", "sütun2" ve "sütun3" olduğunu görüyoruz.

0-4 arasında değişen dikey sayılar konusunda kafanız karışmasın. Bize satırların konumu hakkında bilgi verirler.

Python'da satır numaralandırması sıfır ile başlar.

Artık sütunları ve satırları saymak için Python'u kullanabiliriz.

Sütun sayısını bulmak için df.shape[1] kullanabiliriz:

Örnek

Sütun sayısını sayın:

count_column = df.shape[1]
print(count_column)

Satır sayısını bulmak için df.shape[0] kullanabiliriz:

Örnek

Satır sayısını sayın:

count_row = df.shape[0]
print(count_row)

Neden Satırları ve Sütunları Kendimiz Sayamıyoruz?

Çok sayıda sütun ve satır içeren daha büyük veri kümeleriyle çalışırsak, bunları kendi başınıza saymak kafa karıştırıcı olacaktır. Yanlış sayma riskiniz var. Python'da yerleşik işlevleri doğru kullanırsak, sayımın doğru olduğundan emin oluruz.