Buku ini sedang dalam tahap tinjauan terbuka. Kami ingin umpan balik Anda untuk membuat buku ini lebih baik bagi. Anda dapat memberikan anotasi pada beberapa teks dengan memilihnya menggunakan kursor dan kemudian klik “Beri Anotasi” pada menu pop-up. Anda juga dapat melihat anotasi orang lain: klik tanda panah di sudut kanan atas halaman

8.3 Perbandingan Dendogram

Dalam analisis klaster hierarkis, dendrogram adalah representasi grafis yang menunjukkan bagaimana objek dikelompokkan secara hierarkis berdasarkan kemiripan atau jarak mereka. Namun, hasil klastering dapat sangat dipengaruhi oleh metode yang digunakan untuk menghitung jarak antar objek maupun cara menggabungkan klaster. Oleh karena itu, membandingkan dendrogram yang dihasilkan oleh berbagai metode menjadi langkah penting untuk mengevaluasi konsistensi dan validitas struktur klaster.

Membandingkan dua dendrogram melibatkan analisis kesamaan struktur yang dihasilkan oleh metode klastering yang berbeda. Hal ini dapat membantu mengidentifikasi pola yang stabil dalam data serta mendeteksi perbedaan yang muncul akibat perubahan algoritma, metrik jarak, atau parameter lainnya. Dengan memahami perbedaan ini, peneliti dapat memilih metode klastering yang paling sesuai dengan tujuan analisis dan karakteristik dataset.

Pendekatan untuk membandingkan dendrogram mencakup visualisasi seperti tanglegram, yang menunjukkan kesamaan dan perbedaan hubungan antar klaster, serta metrik kuantitatif seperti korelasi kophenetik. Analisis semacam ini memberikan wawasan yang mendalam tentang bagaimana data dikelompokkan, sekaligus memastikan bahwa hasil klastering relevan dan dapat diandalkan.

# Memuat pustaka dendextend
library(dendextend)

# Menghitung matriks jarak dengan metode Euclidean
res.dist <- dist(df, method = "euclidean")

# Melakukan hierarchical clustering dengan dua metode berbeda
hc1 <- hclust(res.dist, method = "average")  # Average linkage
hc2 <- hclust(res.dist, method = "ward.D2")  # Ward's method

# Mengubah hasil clustering menjadi objek dendrogram
dend1 <- as.dendrogram(hc1)
dend2 <- as.dendrogram(hc2)

# Membuat daftar untuk menyimpan dendrogram
dend_list <- dendlist(dend1, dend2)

Kode berikut digunakan untuk membuat tanglegram sederhana, yaitu representasi visual untuk membandingkan dua dendrogram:

tanglegram(dend1, dend2)
Perbandingan dua Dendogram

Gambar 8.4: Perbandingan dua Dendogram

Kode berikut digunakan untuk membuat tanglegram dengan penyesuaian tertentu untuk menyoroti cabang yang sama (common branches) antara dua dendrogram:

tanglegram(dend1, dend2,
           highlight_distinct_edges = FALSE, # Nonaktifkan garis putus-putus
           common_subtrees_color_lines = FALSE, # Nonaktifkan pewarnaan garis
           common_subtrees_color_branches = TRUE, # Warnai cabang yang sama
           main = paste("Entanglement =", round(entanglement(dend_list), 2))
)
Perbandingan dua Dendogram

Gambar 8.5: Perbandingan dua Dendogram