Visualisasi data Kategorik Multivariat
Ahmad Husain A
19 November 2017
Pada kesempatan ini saya akan mencoba berbagi cara visualisasi data kategori. Sebelumnya sobat dapat intip materi R Dasar untuk visualisasi data. (Sambil promo :D)
Load package
Load package yang diperlukan diantaranya: ggplot2, ggpubr. Silahkan ikuti perintah dibawah ini pada lembar kerja R.library(ggplot2)
library(ggpubr)
## Loading required package: magrittr
theme_set(theme_pubr())
Diagram Batang
Pada kasus ini menggunakan data simulasi bawaan package ggplot2 yaitu data HairEyeColor. Kumpulan data rambut, warna mata, dan jenis kelamin pada 592 mahasiswa statistika. Siapkan dan periksa data menggunakan perintah berikut:data("HairEyeColor")
df <- as.data.frame(HairEyeColor)
head(df)
## Hair Eye Sex Freq
## 1 Black Brown Male 32
## 2 Brown Brown Male 53
## 3 Red Brown Male 10
## 4 Blond Brown Male 3
## 5 Black Blue Male 11
## 6 Brown Blue Male 50
- Membuat diagram batang:
- variabel Hair color pada sumbu x
- Ubah perintah fill dengan eye color
- Bagi grafik menjadi dua bagian berdasarkan sex
ggplot(df, aes(x = Hair, y = Freq))+
geom_bar(
aes(fill = Eye), stat = "identity", color = "white",
position = position_dodge(0.9)
)+
facet_wrap(~Sex) +
fill_palette("jco")
Balloon plot
Diagram balon atau balloon plot merupakan alternatif dari diagram batang untuk visualisasi data kategori yang besar. Kali ini menggunakan fungsi ggballoonplot() untuk menggambarkan grafik dari tabel kontigensi. Dimana masing-masing sel mengandung titik yang ukurannya merupakan refleksi dari besarnya komponen yang ada.Pada simulasi ini menggunakan dataset: data.Silahkan di Unduh :D
data = read.csv("E://BLOG/MATERI/VISUALISASI DATA KATEGORIK MULTIVARIATE/book1.csv", sep = ";", header = TRUE, row.names = 1)
head(data)
## Ikan Invertrebata Reptil Burung Lain
## Hancock 30 4 3 5 16
## Oklawa 18 19 7 1 3
## Trafford 13 18 8 4 10
## George 33 20 1 3 6
- Perintah membuat balloon plot sederhana dari tabel kontigensi.
library(viridis)
## Loading required package: viridisLite
ggballoonplot(data, fill = "value")+
scale_fill_viridis(option = "C")
- Dengan menggunakan dataset HairEyeColor ciptakan plot berganda berdasarkan jenis kelamin.
df <- as.data.frame(HairEyeColor)
ggballoonplot(df, x = "Hair", y = "Eye", size = "Freq",
fill = "Freq", facet.by = "Sex",
ggtheme = theme_bw()) +
scale_fill_viridis(option = "C")
Mosaic Plot
Mosaic plot pada dasarnya adalah visualisasi proporsi area dari frekuensi variabel observasi, yang berbentuk horizontal dan vertikal persegi panjang. Luas masing-masing tile sebanding dengan data yang diberikan.Mosaic plot dapat dibuat dengan menggunakan funsgi mosaicplot(). Contohnya seperti berikut:
library(vcd)
## Loading required package: grid
mosaic(HairEyeColor, shade = TRUE, legend = TRUE)
Sekian, semoga bermanfaat!
- Referensi: Visualitation Multivariate Categorical data. Diakses pada http://www.sthda.com.
waahhh mantaapp
BalasHapus