Veri Kümeleri

  • Kümeler , benzer verilerin koleksiyonlarıdır.
  • Kümeleme , bir tür denetimsiz öğrenmedir.
  • Korelasyon Katsayısı , bir ilişkinin gücünü tanımlar.

kümeler

Kümeler , benzerliğe dayalı veri koleksiyonlarıdır.

Bir grafikte birlikte kümelenen veri noktaları genellikle kümeler halinde sınıflandırılabilir.

Aşağıdaki grafikte 3 farklı kümeyi ayırt edebiliriz:


Kümeleri Tanımlama

Kümeler çok sayıda değerli bilgiyi tutabilir, ancak kümeler her türlü şekilde olabilir, peki onları nasıl tanıyabiliriz?

İki ana yöntem şunlardır:

  • Görselleştirmeyi Kullanma
  • Kümeleme Algoritması Kullanma

kümeleme

Kümeleme , bir Denetimsiz Öğrenme türüdür .

Kümeleme şunları yapmaya çalışıyor:

  • Gruplar halinde benzer verileri toplayın
  • Diğer gruplarda birbirine benzemeyen verileri toplayın

Kümeleme Yöntemleri

  • Yoğunluk Yöntemi
  • Hiyerarşik Yöntem
  • Bölümleme Yöntemi
  • Izgara Tabanlı Yöntem

Yoğunluk Metodu , yoğun bölgelerdeki noktaların daha düşük yoğunluklu bölgedeki noktalara göre daha fazla benzerlik ve farklılığa sahip olduğunu kabul eder. Yoğunluk yöntemi iyi bir doğruluğa sahiptir. Ayrıca kümeleri birleştirme yeteneğine de sahiptir.
İki yaygın algoritma DBSCAN ve OPTICS'tir.

Hiyerarşik Yöntem , kümeleri ağaç tipi bir yapıda oluşturur. Önceden oluşturulmuş kümeler kullanılarak yeni kümeler oluşturulur.
İki yaygın algoritma CURE ve BIRCH'dir.

Izgara Tabanlı Yöntem , verileri ızgara benzeri bir yapı oluşturan sonlu sayıda hücreye formüle eder.
İki yaygın algoritma CLIQUE ve STING'dir.

Partitioning Method , nesneleri k kümeye böler ve her bölüm bir küme oluşturur.
Yaygın bir algoritma CLARANS'tır.


Korelasyon katsayısı

Korelasyon Katsayısı (r) , bir dağılım grafiğindeki doğrusal bir ilişkinin ve x/y değişkenlerinin gücünü ve yönünü tanımlar.

r değeri her zaman -1 ile +1 arasındadır:

-1.00Mükemmel yokuş aşağıNegatif doğrusal ilişki.
-0.70Güçlü yokuş aşağıNegatif doğrusal ilişki.
-0.50Orta yokuş aşağıNegatif doğrusal ilişki.
-0.30Yokuş aşağı zayıfNegatif doğrusal ilişki.
0Doğrusal bir ilişki yok.
+0.30Yokuş yukarı zayıfPozitif doğrusal ilişki.
+0.50Orta yokuş yukarıPozitif doğrusal ilişki.
+0.70Güçlü yokuş yukarıPozitif doğrusal ilişki.
+1.00Mükemmel yokuş yukarıPozitif doğrusal ilişki.

Mükemmel Yokuş +1.00 :

Mükemmel İniş -1.00 :

'

Güçlü Yokuş +0.61 :

İlişki Yok :