R dasar untuk visualisasi data
Ahmad Husain A
18 November 2017
Install dan Load Package yang dibutuhkan
Beberapa package yang harus di install diantaranya:
readr: untuk import data kedalam R
dplyr: untuk manipulasi data
ggplot2 dan ggpubr untuk visualisasi data
Package ggplot2 membuat mudah user pemula untuk membuat plot visualisasi.
Seluruh package yang tersebut di atas dikemas dalam satu package bernama tidyverse. Sehingga jika melakukan installasi tidyverse sudah otomatis tersintall packages readr, dplyr, ggplot dan lain-lain. Ketik perintah berikut untuk install:
install.packages(“tidyverse”)
install.packages(“ggpubr”)
Load package yang dibutuhkan
Setelah tahapan installasi, langkah pertama user harus load package untuk menggunakan fungsi yang terdapat pada package. Perintah library() digunakan pada tahapan ini. Atau cara lain dapat menggunakan perintah require(). Untuk contoh, load package ggplot2 dan ggpubr, ketik seperti berikut:
library(ggplot2)
library(ggpubr)
## Loading required package: magrittr
Sekarang, user dapat menggunakan fungsi R, seperti ggscatter() [yang terdapat pada package ggpubr] untuk membuat scatter plot.
Memasukkan data ke dalam R
data = read.csv("E://BLOG/MATERI/R DASAR UNTUK VISUALISASI DATA/Data Diabetes.csv", sep =",", header = TRUE)
head(data) #Melihat data teratas
## Pregnancies Glucose BloodPressure SkinThickness Insulin BMI
## 1 6 148 72 35 0 33.6
## 2 1 85 66 29 0 26.6
## 3 8 183 64 0 0 23.3
## 4 1 89 66 23 94 28.1
## 5 0 137 40 35 168 43.1
## 6 5 116 74 0 0 25.6
## DiabetesPedigreeFunction Age keterangan
## 1 0.627 50 Tidak Diabetes
## 2 0.351 31 Tidak Diabetes
## 3 0.672 32 Diabetes
## 4 0.167 21 Tidak Diabetes
## 5 2.288 33 Tidak Diabetes
## 6 0.201 30 Tidak Diabetes
tail(data) #Melihat data terbawah
## Pregnancies Glucose BloodPressure SkinThickness Insulin BMI
## 763 9 89 62 0 0 22.5
## 764 10 101 76 48 180 32.9
## 765 2 122 70 27 0 36.8
## 766 5 121 72 23 112 26.2
## 767 1 126 60 0 0 30.1
## 768 1 93 70 31 0 30.4
## DiabetesPedigreeFunction Age keterangan
## 763 0.142 33 Tidak Diabetes
## 764 0.171 63 Tidak Diabetes
## 765 0.340 27 Tidak Diabetes
## 766 0.245 30 Tidak Diabetes
## 767 0.349 47 Tidak Diabetes
## 768 0.315 23 Tidak Diabetes
- Untuk mengunduh file simulasi dapat klik tautan berikut data.
Perintah read.csv()
untuk memanggil data kedalam direktori kerja R. Pembahasan lebih rinci dapat melihat pada materi Direktori kerja di R.
Manipulasi Data
Setelah memasukkan data ke R, user dapat dengan mudah memanipulasi data itu dengan menggunakan package dplyr Setelah package dplyr di load, user dapat menggunakan beberapa fungsi seperti berikut:
- filter(): memilih baris(observasi) berdasarkan nilainya.
- distinct(): Menghilangkan baris yang terduplikasi.
- arrange(): Menyusun ulang baris.
- select(): Memilih kolom (variabel) sesuai dengan namanya.
- rename(): Mengubah nama kolom.
- mutate(): Menambah/membuat variabel baru.
- summarise(): Ringkasan komputasi statistika seperti mean, sum dan lain-lain.
Basis Grafik di R
R mempunyai fungsi yang sederhana untuk membuat grafik, diantaranya:
Plot.Types | R.base.function |
---|---|
Scatter plot | plot() |
Scatter plot matrix | pairs() |
Box plot | boxplot() |
Strip chart | stripchart() |
Histogram plot | hist() |
density plot | density() |
Bar plot | barplot() |
Line plot | plot() dan line() |
Pie charts | pie() |
Dot charts | dotchart() |
Add text to a plot | text() |
Menggunakan fungsi R, kita akan menggunakan data untuk membuat scatter plot dan boxplot.
plot(x = data$BloodPressure, y = data$Glucose, pch = 19, cex = 0.8, frame = FALSE, xlab = "Tekanan darah", ylab = "Kadar Gula")
boxplot(Age ~ keterangan, data = data, ylab = "Umur", frame = FALSE, col = "lightgray")
Package lattice grafik
Package lattice menyediakan fungsi plotting untuk meningkatkan Grafik basis di R. Cara installasinya seperti berikut:
install.packages(“lattice”) ketik perintah tersebut pada program R.
Membuat scatter plot dasar dari y oleh x.
library(lattice)
xyplot(
Glucose ~ BloodPressure, group = keterangan, data=data, auto.key = TRUE, pch = 19, cex = 0.5
)
- Membuat plot panel oleh grup. y~x | group
xyplot( Glucose ~ BloodPressure | keterangan, layout = c(3,1), group = keterangan, data = data, type = c("p", "smooth"), scale = "free")
Package ggplot2 grafik
ggplot2 sangat powerful dan package yang fleksibel.
library(ggplot2)
ggplot(data, aes(x = Glucose, y = BloodPressure))+
geom_point()
ggplot(data, aes(x = Glucose, y = BloodPressure))+
geom_point(size = 1.2, color = "steelblue", shape = 21)
Sekian, semoga bermanfaat! :)
- Referensi: R Graphics Essentials diakses pada http://www.sthda.com secara daring 18 November 2017.
Tidak ada komentar:
Posting Komentar