R Dağılım Grafiği


Dağılım Grafikleri

Plot bölümünden , plot()fonksiyonun sayıları birbirine göre çizmek için kullanıldığını öğrendiniz .

Bir "dağılım grafiği", iki sayısal değişken arasındaki ilişkiyi görüntülemek için kullanılan bir çizim türüdür ve her gözlem için bir nokta çizer.

Biri x ekseni (yatay) ve diğeri y ekseni (dikey) için olmak üzere aynı uzunlukta iki vektöre ihtiyaç duyar:

Örnek

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

Sonuç:

Yukarıdaki örnekteki gözlem, geçen 12 arabanın sonucunu göstermelidir.

Grafiği ilk kez gören biri için bu net olmayabilir, bu nedenle dağılım grafiğini daha iyi açıklamak için bir başlık ve farklı etiketler ekleyelim:

Örnek

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

Sonuç:

Özetlemek gerekirse, yukarıdaki örnekteki gözlem, geçen 12 arabanın sonucudur.

X ekseni , arabanın kaç yaşında olduğunu gösterir .

Y ekseni , arabanın geçtiği andaki hızını gösterir.

Gözlemler arasında herhangi bir ilişki var mı?

Görünüşe göre araba ne kadar yeniyse o kadar hızlı sürüyor, ancak bu bir tesadüf olabilir, sonuçta sadece 12 araba kaydettik.


Arsaları Karşılaştır

Yukarıdaki örnekte, arabanın hızı ile yaşı arasında bir ilişki var gibi görünüyor, peki ya başka bir günün gözlemlerini de çizersek? Dağılım grafiği bize başka bir şey söyleyecek mi?

Grafiği başka bir çizimle karşılaştırmak için şu points()işlevi kullanın:

Örnek

Aynı şekle iki grafik çizin:

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

Sonuç:

Not: Karşılaştırmanın farkını görebilmek için ( colparametreyi kullanarak) grafiklere farklı renkler atamanız gerekir. Kırmızı , 1. günün değerlerini, mavicex ise 2. günü temsil eder . Noktaların boyutunu artırmak için parametreyi de eklediğimizi unutmayın .

Gözlemin sonucu: İki grafiği karşılaştırarak, ikisinin de bize aynı sonucu verdiğini söylemenin güvenli olduğunu düşünüyorum: araba ne kadar yeniyse, o kadar hızlı sürer.