Pandalar - Çizim



çizim

Pandalar, plot()diyagramlar oluşturmak için yöntemi kullanır.

Diyagramı ekranda görselleştirmek için Matplotlib kütüphanesinin bir alt modülü olan Pyplot'u kullanabiliriz.

Matplotlib Eğitimimizde Matplotlib hakkında daha fazla bilgi edinin .

Örnek

Pyplot'u Matplotlib'den içe aktarın ve DataFrame'imizi görselleştirin:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

Bu sayfadaki örnekler, 'data.csv' adlı bir CSV dosyası kullanır.

data.csv'yi indirin veya data.csv'yi açın


Dağılım grafiği

kindArgümanla birlikte bir dağılım grafiği istediğinizi belirtin :

kind = 'scatter'

Bir dağılım grafiği bir x ve bir y eksenine ihtiyaç duyar.

Aşağıdaki örnekte x ekseni için "Süre" ve y ekseni için "Kalori" kullanacağız.

Bunun gibi x ve y argümanlarını ekleyin:

x = 'Duration', y = 'Calories'

Örnek

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

Sonuç

Unutmayın: Bir önceki örnekte, "Süre" ile "Kalori" arasındaki ilişkinin ' olduğunu öğrenmiştik ve 0.922721daha uzun sürenin daha fazla kalori yakılması anlamına geldiği gerçeğiyle sonuçlandırdık.

Dağılım grafiğine bakarak, aynı fikirdeyim.

Sütunlar arasında "Süre" ve "Maxpulse" gibi kötü bir ilişkinin olduğu, korelasyonla başka bir dağılım grafiği oluşturalım 0.009403:

Örnek

Sütunlar arasında hiçbir ilişkinin olmadığı bir dağılım grafiği:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

Sonuç


w3schools CERTIFIED . 2021

Sertikalı olmak!

Panda modüllerini tamamlayın, alıştırmaları yapın, sınava girin ve w3schools sertifikalı olacaksınız!

$10 KAYIT

histogram

kindBir histogram istediğinizi belirtmek için bağımsız değişkeni kullanın :

kind = 'hist'

Bir histogramın yalnızca bir sütuna ihtiyacı vardır.

Bir histogram bize her aralığın sıklığını gösterir, örneğin 50 ila 60 dakika arasında kaç antrenman sürdü?

Aşağıdaki örnekte, histogramı oluşturmak için "Süre" sütununu kullanacağız:

Örnek

df["Duration"].plot(kind = 'hist')

Sonuç

Not: Histogram bize 50 ile 60 dakika arasında süren 100'den fazla antrenman olduğunu söylüyor.


Egzersizlerle Kendinizi Test Edin

Egzersiz yapmak:

DataFrame'deki verileri bir diyagram (çizim) olarak görselleştirmek için doğru bir sözdizimi ekleyin.

df.()