1.2 Pengenalan Singkat R and RStudio
Instalasi R dan RStudio
Untuk memulai menggunakan R, langkah pertama adalah menginstal perangkat lunaknya. Berikut langkah-langkah instalasinya:
Buka situs resmi CRAN (Comprehensive R Archive Network)
Pilih sistem operasi yang digunakan (Windows, macOS, atau Linux).
Unduh file instalasi dan ikuti instruksi instalasinya. Unduh dan Instal RStudio
Setelah R terinstal, unduh RStudio, sebuah Integrated Development Environment (IDE) untuk R, dari https://www.rstudio.com. Pilih versi gratis (RStudio Desktop) dan instal sesuai dengan sistem operasi Anda.
RStudio adalah IDE yang dirancang khusus untuk mempermudah penggunaan R. Dibandingkan dengan antarmuka dasar R, RStudio menawarkan pengalaman pengguna yang lebih nyaman melalui fitur-fitur berikut:
Script Editor: Memungkinkan penulisan dan pengelolaan skrip dengan mudah.
Console: Tempat menjalankan perintah R secara langsung.
Environment Pane: Menampilkan variabel, data, dan objek yang sedang aktif.
Plots Pane: Menampilkan hasil visualisasi seperti grafik dan plot.
Packages Pane: Memudahkan instalasi dan pengelolaan pustaka.

Gambar 1.1: RStudio: empat panel
CRAN (Comprehensive R Archive Network) adalah repositori resmi yang menyimpan ribuan paket tambahan untuk memperluas fungsi R. Paket-paket ini mencakup berbagai bidang aplikasi, seperti statistik, visualisasi, dan machine learning. Untuk mengunduh dan menginstal paket di R, langkah-langkahnya adalah sebagai berikut:
Buka RStudio dan pastikan Anda terhubung ke internet.
Gunakan perintah
install.packages()
untuk menginstal library atau paket.Setelah instalasi selesai, muat paket ke dalam sesi kerja menggunakan perintah
library()
. Contoh:
Paket yang diunduh akan otomatis tersimpan di komputer Anda dan dapat digunakan kapan saja tanpa perlu mengunduh ulang. Dengan CRAN, pengguna dapat dengan mudah menyesuaikan R untuk berbagai kebutuhan analisis data.
Dasar-Dasar R
Seperti disebutkan sebelumnya, buku ini bukan dimaksudkan sebagai pengantar R, melainkan panduan tentang cara memanfaatkan kemampuannya untuk aplikasi yang umum analisis cluster dengan R. Pembaca yang memiliki pengetahuan dasar tentang pemrograman R mungkin akan merasa nyaman untuk langsung memulai dari Bab 4. Namun, bagian ini ditujukan bagi mereka yang belum pernah bekerja dengan R atau RStudio sebelumnya. Jika Anda setidaknya sudah tahu cara membuat objek dan memanggil fungsi, Anda bisa melewati bagian ini.
Objek dan Variabel Dalam R, objek adalah entitas yang menyimpan data atau hasil perhitungan. Objek bisa berupa angka, teks, tabel, atau bahkan fungsi. Setiap objek di R memiliki nama yang digunakan untuk merujuknya dalam kode, dan objek ini dapat disimpan ke dalam variabel untuk memudahkan manipulasi data.
Variabel adalah nama yang diberikan untuk menyimpan nilai atau objek. Variabel di R tidak memerlukan deklarasi tipe data sebelumnya, yang berarti kita dapat langsung menyimpan nilai apapun ke dalam variabel tersebut.
Variabel dapat dibuat dengan cara memberi nama pada objek dan
menggunakan operator penugasan <-
untuk menyimpan nilai ke dalam
variabel.
x <- 5 # Menyimpan angka 5 dalam variabel x
nama <- "John" # Menyimpan string "John" dalam variabel nama
Di atas, x
dan nama
adalah variabel yang menyimpan objek berupa
angka dan teks.
Mengakses Variabel Setelah variabel dibuat, kita dapat mengakses nilai yang tersimpan dalam variabel tersebut dengan cukup menyebutkan nama variabel:
Tipe Data dalam Variabel
Variabel di R dapat menyimpan berbagai tipe data, antara lain:
Numerik: Menyimpan angka dengan atau tanpa desimal.
Karakter (String): Menyimpan teks.
Logika: Menyimpan nilai TRUE atau FALSE.
Faktor: Digunakan untuk variabel kategorikal.
Daftar (List), Vektor, Matriks, dan Data Frame: Struktur data kompleks yang menyimpan koleksi data.
Contoh variabel dengan berbagai tipe data:
Struktur Data pada R
R menyediakan berbagai jenis struktur data untuk mengelola dan memanipulasi data dalam berbagai bentuk. Pemahaman tentang struktur data di R sangat penting karena memungkinkan kita untuk menyimpan dan bekerja dengan data yang lebih kompleks. Beberapa struktur data dasar yang tersedia di R meliputi vektor, matriks, data frame, dan list.
Vektor
Vektor adalah struktur data paling dasar di R. Vektor
adalah sekumpulan elemen yang memiliki tipe data yang sama, seperti
angka, karakter, atau logika. Vektor dapat dibuat menggunakan fungsi
c()
, yang berarti combine atau concatenate. Contoh pembuatan vektor:
vektor_angka <- c(1, 2, 3, 4, 5) # Vektor angka
vektor_karakter <- c("A", "B", "C") # Vektor karakter
vektor_logika <- c(TRUE, FALSE, TRUE) # Vektor logika
Mengakses elemen vektor:
vektor_angka[1] # Mengakses elemen pertama (1)
#> [1] 1
vektor_karakter[2] # Mengakses elemen kedua ("B")
#> [1] "B"
Vektor bisa berupa vektor numerik, vektor karakter, atau vektor logika, tergantung tipe data elemen yang ada di dalamnya.
Matriks
Matriks adalah struktur data dua dimensi, yang berarti memiliki baris dan kolom. Semua elemen dalam matriks harus memiliki tipe data yang sama, seperti vektor. Contoh pembuatan matriks:
Data Frame
Data frame adalah struktur data yang lebih kompleks dan sering digunakan dalam analisis data. Data frame terdiri dari kolom-kolom yang dapat memiliki tipe data yang berbeda (numerik, karakter, logika, dll.), mirip dengan tabel dalam basis data atau spreadsheet. Contoh pembuatan data frame:
List
List adalah struktur data yang paling fleksibel di R. List dapat menyimpan berbagai jenis objek yang berbeda dalam satu struktur data, termasuk vektor, matriks, data frame, atau bahkan fungsi. Contoh pembuatan list:
Vektor
Faktor adalah tipe data di R yang digunakan untuk menyimpan data kategorikal. Faktor menyimpan data dalam bentuk level yang dapat digunakan untuk analisis kategorikal, seperti dalam model regresi atau analisis statistik lainnya. Contoh pembuatan faktor:
status <- factor(c("Single", "Married", "Single", "Divorced"))
print(status)
#> [1] Single Married Single Divorced
#> Levels: Divorced Married Single
Berikut adalah perbandingan antara berbagai struktur data di R:
Struktur Data | Deskripsi | Contoh Penggunaan |
---|---|---|
Vektor | Sekumpulan elemen dengan tipe data yang sama | Menyimpan data numerik atau karakter |
Matriks | Struktur dua dimensi (baris dan kolom) | Menyimpan data dalam bentuk tabel numerik |
Data Frame | Tabel dua dimensi dengan tipe data berbeda | Menyimpan data observasi dan variabel |
List | Koleksi elemen dengan tipe data yang berbeda | Menyimpan objek dengan tipe data campuran |
Faktor | Data kategorikal dengan level yang terbatas | Mengelompokkan data kategorikal |
Fungsi dan Pemrograman di R
R menyediakan berbagai cara untuk mendefinisikan dan menggunakan fungsi dalam pemrograman. Fungsi adalah blok kode yang dirancang untuk melakukan tugas tertentu, menerima input, dan memberikan output. Pemrograman berbasis fungsi memungkinkan pengguna untuk menulis kode yang lebih modular dan terstruktur, yang memudahkan pemeliharaan dan pengembangan program.
Definisi Fungsi
Fungsi di R dibuat menggunakan kata kunci function()
.
Fungsi ini dapat menerima satu atau lebih argumen dan menghasilkan nilai
output. Contoh pembuatan fungsi:
Argumen fungsi
Fungsi di R dapat menerima berbagai jenis argumen, yang bisa berupa variabel, nilai tetap, atau objek lain. Argumen juga bisa diberikan nilai default, yang berarti fungsi tetap dapat dipanggil meskipun beberapa argumen tidak diberikan nilai. Contoh argumen dengan nilai default:
Fungsi dengan Beberapa Nilai Kembalian
Fungsi di R dapat mengembalikan lebih dari satu nilai. Salah satu cara untuk melakukan ini adalah dengan menggunakan list. Fungsi dapat mengembalikan objek yang lebih kompleks, seperti list, untuk menyimpan beberapa hasil sekaligus. Contoh fungsi dengan beberapa nilai kembalian:
Fungsi Bawaan di R
R menyediakan banyak fungsi bawaan untuk melakukan berbagai tugas, seperti manipulasi data, analisis statistik, dan visualisasi. Fungsi-fungsi ini sangat berguna dan sering digunakan dalam berbagai analisis. Contoh fungsi bawaan:
Fungsi Anonim
Fungsi anonim adalah fungsi yang tidak memiliki nama. Fungsi jenis ini sering digunakan dalam operasi sementara atau dalam konteks tertentu, seperti dalam operasi dengan apply atau pemrograman berbasis vektor. Contoh fungsi anonim:
# Menggunakan fungsi anonim dalam apply
angka <- c(1, 2, 3, 4, 5)
hasil <- sapply(angka, function(x) x^2) # Menerapkan fungsi untuk menghitung kuadrat
print(hasil) # Output: 1 4 9 16 25
#> [1] 1 4 9 16 25
Semua perintah yang telah dijelaskan di atas juga dapat digunakan pada widget interaktif di seluruh buku ini. Anda dapat mencobanya di bawah ini.