Veri Bilimi - Python DataFrame
Pandalarla DataFrame Oluşturun
Veri çerçevesi, verilerin yapılandırılmış bir temsilidir.
Kurgusal sayılarla 3 sütun ve 5 satırdan oluşan bir veri çerçevesi tanımlayalım:
Örnek
import pandas as pd
d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9,
5], 'col3': [7, 8, 12, 1, 11]}
df = pd.DataFrame(data=d)
print(df)
Örnek Açıklama
- Pandalar kitaplığını pd olarak içe aktarın
- d adlı bir değişkende sütun ve satırlarla verileri tanımlayın
- pd.DataFrame() işlevini kullanarak bir veri çerçevesi oluşturun
- Veri çerçevesi 3 sütun ve 5 satır içerir
- print() işleviyle veri çerçevesi çıktısını yazdırın
pd yazıyoruz . Python'un Pandas kitaplığından DataFrame() işlevini etkinleştirmek istediğimizi bilmesini sağlamak için DataFrame() ' in önünde .
DataFrame'de büyük D ve F harflerinin farkında olun!
Çıktının Yorumlanması
Bu çıktı:
Sütunların adlarının "sütun1", "sütun2" ve "sütun3" olduğunu görüyoruz.
0-4 arasında değişen dikey sayılar konusunda kafanız karışmasın. Bize satırların konumu hakkında bilgi verirler.
Python'da satır numaralandırması sıfır ile başlar.
Artık sütunları ve satırları saymak için Python'u kullanabiliriz.
Sütun sayısını bulmak için df.shape[1] kullanabiliriz:
Örnek
Sütun sayısını sayın:
count_column = df.shape[1]
print(count_column)
Satır sayısını bulmak için df.shape[0] kullanabiliriz:
Örnek
Satır sayısını sayın:
count_row = df.shape[0]
print(count_row)
Neden Satırları ve Sütunları Kendimiz Sayamıyoruz?
Çok sayıda sütun ve satır içeren daha büyük veri kümeleriyle çalışırsak, bunları kendi başınıza saymak kafa karıştırıcı olacaktır. Yanlış sayma riskiniz var. Python'da yerleşik işlevleri doğru kullanırsak, sayımın doğru olduğundan emin oluruz.