Veri Kümeleri
- Kümeler , benzer verilerin koleksiyonlarıdır.
- Kümeleme , bir tür denetimsiz öğrenmedir.
- Korelasyon Katsayısı , bir ilişkinin gücünü tanımlar.
kümeler
Kümeler , benzerliğe dayalı veri koleksiyonlarıdır.
Bir grafikte birlikte kümelenen veri noktaları genellikle kümeler halinde sınıflandırılabilir.
Aşağıdaki grafikte 3 farklı kümeyi ayırt edebiliriz:
Kümeleri Tanımlama
Kümeler çok sayıda değerli bilgiyi tutabilir, ancak kümeler her türlü şekilde olabilir, peki onları nasıl tanıyabiliriz?
İki ana yöntem şunlardır:
- Görselleştirmeyi Kullanma
- Kümeleme Algoritması Kullanma
kümeleme
Kümeleme , bir Denetimsiz Öğrenme türüdür .
Kümeleme şunları yapmaya çalışıyor:
- Gruplar halinde benzer verileri toplayın
- Diğer gruplarda birbirine benzemeyen verileri toplayın
Kümeleme Yöntemleri
- Yoğunluk Yöntemi
- Hiyerarşik Yöntem
- Bölümleme Yöntemi
- Izgara Tabanlı Yöntem
Yoğunluk Metodu , yoğun bölgelerdeki noktaların daha düşük yoğunluklu bölgedeki noktalara göre daha fazla benzerlik ve farklılığa sahip olduğunu kabul eder. Yoğunluk yöntemi iyi bir doğruluğa sahiptir. Ayrıca kümeleri birleştirme yeteneğine de sahiptir.
İki yaygın algoritma DBSCAN ve OPTICS'tir.
Hiyerarşik Yöntem , kümeleri ağaç tipi bir yapıda oluşturur. Önceden oluşturulmuş kümeler kullanılarak yeni kümeler oluşturulur.
İki yaygın algoritma CURE ve BIRCH'dir.
Izgara Tabanlı Yöntem , verileri ızgara benzeri bir yapı oluşturan sonlu sayıda hücreye formüle eder.
İki yaygın algoritma CLIQUE ve STING'dir.
Partitioning Method , nesneleri k kümeye böler ve her bölüm bir küme oluşturur.
Yaygın bir algoritma CLARANS'tır.
Korelasyon katsayısı
Korelasyon Katsayısı (r) , bir dağılım grafiğindeki doğrusal bir ilişkinin ve x/y değişkenlerinin gücünü ve yönünü tanımlar.
r değeri her zaman -1 ile +1 arasındadır:
-1.00 | Mükemmel yokuş aşağı | Negatif doğrusal ilişki. |
-0.70 | Güçlü yokuş aşağı | Negatif doğrusal ilişki. |
-0.50 | Orta yokuş aşağı | Negatif doğrusal ilişki. |
-0.30 | Yokuş aşağı zayıf | Negatif doğrusal ilişki. |
0 | Doğrusal bir ilişki yok. | |
+0.30 | Yokuş yukarı zayıf | Pozitif doğrusal ilişki. |
+0.50 | Orta yokuş yukarı | Pozitif doğrusal ilişki. |
+0.70 | Güçlü yokuş yukarı | Pozitif doğrusal ilişki. |
+1.00 | Mükemmel yokuş yukarı | Pozitif doğrusal ilişki. |
Mükemmel Yokuş +1.00 :
Mükemmel İniş -1.00 :
Güçlü Yokuş +0.61 :
İlişki Yok :