R Dasar untuk visualisasi data

R dasar untuk visualisasi data

Install dan Load Package yang dibutuhkan

Beberapa package yang harus di install diantaranya:

  1. readr: untuk import data kedalam R

  2. dplyr: untuk manipulasi data

  3. ggplot2 dan ggpubr untuk visualisasi data

Package ggplot2 membuat mudah user pemula untuk membuat plot visualisasi.

Seluruh package yang tersebut di atas dikemas dalam satu package bernama tidyverse. Sehingga jika melakukan installasi tidyverse sudah otomatis tersintall packages readr, dplyr, ggplot dan lain-lain. Ketik perintah berikut untuk install:

  • install.packages(“tidyverse”)

  • install.packages(“ggpubr”)

Load package yang dibutuhkan

Setelah tahapan installasi, langkah pertama user harus load package untuk menggunakan fungsi yang terdapat pada package. Perintah library() digunakan pada tahapan ini. Atau cara lain dapat menggunakan perintah require(). Untuk contoh, load package ggplot2 dan ggpubr, ketik seperti berikut:

library(ggplot2)
library(ggpubr)
## Loading required package: magrittr

Sekarang, user dapat menggunakan fungsi R, seperti ggscatter() [yang terdapat pada package ggpubr] untuk membuat scatter plot.

Memasukkan data ke dalam R

data = read.csv("E://BLOG/MATERI/R DASAR UNTUK VISUALISASI DATA/Data Diabetes.csv", sep =",", header = TRUE)
head(data) #Melihat data teratas
##   Pregnancies Glucose BloodPressure SkinThickness Insulin  BMI
## 1           6     148            72            35       0 33.6
## 2           1      85            66            29       0 26.6
## 3           8     183            64             0       0 23.3
## 4           1      89            66            23      94 28.1
## 5           0     137            40            35     168 43.1
## 6           5     116            74             0       0 25.6
##   DiabetesPedigreeFunction Age     keterangan
## 1                    0.627  50 Tidak Diabetes
## 2                    0.351  31 Tidak Diabetes
## 3                    0.672  32       Diabetes
## 4                    0.167  21 Tidak Diabetes
## 5                    2.288  33 Tidak Diabetes
## 6                    0.201  30 Tidak Diabetes
tail(data) #Melihat data terbawah
##     Pregnancies Glucose BloodPressure SkinThickness Insulin  BMI
## 763           9      89            62             0       0 22.5
## 764          10     101            76            48     180 32.9
## 765           2     122            70            27       0 36.8
## 766           5     121            72            23     112 26.2
## 767           1     126            60             0       0 30.1
## 768           1      93            70            31       0 30.4
##     DiabetesPedigreeFunction Age     keterangan
## 763                    0.142  33 Tidak Diabetes
## 764                    0.171  63 Tidak Diabetes
## 765                    0.340  27 Tidak Diabetes
## 766                    0.245  30 Tidak Diabetes
## 767                    0.349  47 Tidak Diabetes
## 768                    0.315  23 Tidak Diabetes
  • Untuk mengunduh file simulasi dapat klik tautan berikut data.

Perintah read.csv() untuk memanggil data kedalam direktori kerja R. Pembahasan lebih rinci dapat melihat pada materi Direktori kerja di R.

Manipulasi Data

Setelah memasukkan data ke R, user dapat dengan mudah memanipulasi data itu dengan menggunakan package dplyr Setelah package dplyr di load, user dapat menggunakan beberapa fungsi seperti berikut:

  • filter(): memilih baris(observasi) berdasarkan nilainya.
  • distinct(): Menghilangkan baris yang terduplikasi.
  • arrange(): Menyusun ulang baris.
  • select(): Memilih kolom (variabel) sesuai dengan namanya.
  • rename(): Mengubah nama kolom.
  • mutate(): Menambah/membuat variabel baru.
  • summarise(): Ringkasan komputasi statistika seperti mean, sum dan lain-lain.

Basis Grafik di R

R mempunyai fungsi yang sederhana untuk membuat grafik, diantaranya:

Tabel perintah membuat grafik di R
Plot.Types R.base.function
Scatter plot plot()
Scatter plot matrix pairs()
Box plot boxplot()
Strip chart stripchart()
Histogram plot hist()
density plot density()
Bar plot barplot()
Line plot plot() dan line()
Pie charts pie()
Dot charts dotchart()
Add text to a plot text()

Menggunakan fungsi R, kita akan menggunakan data untuk membuat scatter plot dan boxplot.

plot(x = data$BloodPressure, y = data$Glucose, pch = 19, cex = 0.8, frame = FALSE, xlab = "Tekanan darah", ylab = "Kadar Gula")

boxplot(Age ~ keterangan, data = data, ylab = "Umur", frame = FALSE, col = "lightgray")

Package lattice grafik

Package lattice menyediakan fungsi plotting untuk meningkatkan Grafik basis di R. Cara installasinya seperti berikut:

  • install.packages(“lattice”) ketik perintah tersebut pada program R.

  • Membuat scatter plot dasar dari y oleh x.

library(lattice)
xyplot(
  Glucose ~ BloodPressure, group = keterangan, data=data, auto.key = TRUE, pch = 19, cex = 0.5
)

  • Membuat plot panel oleh grup. y~x | group
xyplot( Glucose ~ BloodPressure | keterangan, layout = c(3,1), group = keterangan, data = data, type = c("p", "smooth"), scale = "free")

Package ggplot2 grafik

ggplot2 sangat powerful dan package yang fleksibel.

library(ggplot2)
ggplot(data, aes(x = Glucose, y = BloodPressure))+
  geom_point()

ggplot(data, aes(x = Glucose, y = BloodPressure))+
  geom_point(size = 1.2, color = "steelblue", shape = 21)

Sekian, semoga bermanfaat! :)

  • Referensi: R Graphics Essentials diakses pada http://www.sthda.com secara daring 18 November 2017.

Tidak ada komentar:

Posting Komentar

Terpopuler