Buku ini sedang dalam tahap tinjauan terbuka. Kami ingin umpan balik Anda untuk membuat buku ini lebih baik bagi. Anda dapat memberikan anotasi pada beberapa teks dengan memilihnya menggunakan kursor dan kemudian klik “Beri Anotasi” pada menu pop-up. Anda juga dapat melihat anotasi orang lain: klik tanda panah di sudut kanan atas halaman

1.2 Pengenalan Singkat R and RStudio

Instalasi R dan RStudio

Untuk memulai menggunakan R, langkah pertama adalah menginstal perangkat lunaknya. Berikut langkah-langkah instalasinya:

  1. Buka situs resmi CRAN (Comprehensive R Archive Network)

  2. Pilih sistem operasi yang digunakan (Windows, macOS, atau Linux).

  3. Unduh file instalasi dan ikuti instruksi instalasinya. Unduh dan Instal RStudio

Setelah R terinstal, unduh RStudio, sebuah Integrated Development Environment (IDE) untuk R, dari https://www.rstudio.com. Pilih versi gratis (RStudio Desktop) dan instal sesuai dengan sistem operasi Anda.

RStudio adalah IDE yang dirancang khusus untuk mempermudah penggunaan R. Dibandingkan dengan antarmuka dasar R, RStudio menawarkan pengalaman pengguna yang lebih nyaman melalui fitur-fitur berikut:

  • Script Editor: Memungkinkan penulisan dan pengelolaan skrip dengan mudah.

  • Console: Tempat menjalankan perintah R secara langsung.

  • Environment Pane: Menampilkan variabel, data, dan objek yang sedang aktif.

  • Plots Pane: Menampilkan hasil visualisasi seperti grafik dan plot.

  • Packages Pane: Memudahkan instalasi dan pengelolaan pustaka.

RStudio: empat panel

Gambar 1.1: RStudio: empat panel

CRAN (Comprehensive R Archive Network) adalah repositori resmi yang menyimpan ribuan paket tambahan untuk memperluas fungsi R. Paket-paket ini mencakup berbagai bidang aplikasi, seperti statistik, visualisasi, dan machine learning. Untuk mengunduh dan menginstal paket di R, langkah-langkahnya adalah sebagai berikut:

  1. Buka RStudio dan pastikan Anda terhubung ke internet.

  2. Gunakan perintah install.packages() untuk menginstal library atau paket.

  3. Setelah instalasi selesai, muat paket ke dalam sesi kerja menggunakan perintah library(). Contoh:

library(ggplot2)

Paket yang diunduh akan otomatis tersimpan di komputer Anda dan dapat digunakan kapan saja tanpa perlu mengunduh ulang. Dengan CRAN, pengguna dapat dengan mudah menyesuaikan R untuk berbagai kebutuhan analisis data.

Dasar-Dasar R

Seperti disebutkan sebelumnya, buku ini bukan dimaksudkan sebagai pengantar R, melainkan panduan tentang cara memanfaatkan kemampuannya untuk aplikasi yang umum analisis cluster dengan R. Pembaca yang memiliki pengetahuan dasar tentang pemrograman R mungkin akan merasa nyaman untuk langsung memulai dari Bab 4. Namun, bagian ini ditujukan bagi mereka yang belum pernah bekerja dengan R atau RStudio sebelumnya. Jika Anda setidaknya sudah tahu cara membuat objek dan memanggil fungsi, Anda bisa melewati bagian ini.

Objek dan Variabel Dalam R, objek adalah entitas yang menyimpan data atau hasil perhitungan. Objek bisa berupa angka, teks, tabel, atau bahkan fungsi. Setiap objek di R memiliki nama yang digunakan untuk merujuknya dalam kode, dan objek ini dapat disimpan ke dalam variabel untuk memudahkan manipulasi data.

Variabel adalah nama yang diberikan untuk menyimpan nilai atau objek. Variabel di R tidak memerlukan deklarasi tipe data sebelumnya, yang berarti kita dapat langsung menyimpan nilai apapun ke dalam variabel tersebut.

Variabel dapat dibuat dengan cara memberi nama pada objek dan menggunakan operator penugasan <- untuk menyimpan nilai ke dalam variabel.

x <- 5      # Menyimpan angka 5 dalam variabel x
nama <- "John"  # Menyimpan string "John" dalam variabel nama

Di atas, x dan nama adalah variabel yang menyimpan objek berupa angka dan teks.

Mengakses Variabel Setelah variabel dibuat, kita dapat mengakses nilai yang tersimpan dalam variabel tersebut dengan cukup menyebutkan nama variabel:

print(x)    # Output: 5
#> [1] 5
print(nama) # Output: "John"
#> [1] "John"

Tipe Data dalam Variabel

Variabel di R dapat menyimpan berbagai tipe data, antara lain:

  • Numerik: Menyimpan angka dengan atau tanpa desimal.

  • Karakter (String): Menyimpan teks.

  • Logika: Menyimpan nilai TRUE atau FALSE.

  • Faktor: Digunakan untuk variabel kategorikal.

  • Daftar (List), Vektor, Matriks, dan Data Frame: Struktur data kompleks yang menyimpan koleksi data.

Contoh variabel dengan berbagai tipe data:

angka <- 10          # Numerik
nama <- "Andi"       # Karakter
status <- TRUE       # Logika
kategori <- factor(c("A", "B", "A", "C"))  # Faktor

Operasi dengan Variabel

Operasi dengan Variabel Variabel dapat digunakan dalam operasi matematika dan logika. Misalnya, jika kita memiliki dua variabel a dan b, kita bisa melakukan operasi penjumlahan:

a <- 3
b <- 4
hasil <- a + b  # Menyimpan hasil penjumlahan a dan b ke dalam variabel hasil
print(hasil)    # Output: 7
#> [1] 7

Menimpa dan Mengubah Nilai Variabel

x <- 5      # x sekarang bernilai 5
x <- 10     # x sekarang bernilai 10 (nilai sebelumnya akan tertimpa)
print(x)    # Output: 10
#> [1] 10

Struktur Data pada R

R menyediakan berbagai jenis struktur data untuk mengelola dan memanipulasi data dalam berbagai bentuk. Pemahaman tentang struktur data di R sangat penting karena memungkinkan kita untuk menyimpan dan bekerja dengan data yang lebih kompleks. Beberapa struktur data dasar yang tersedia di R meliputi vektor, matriks, data frame, dan list.

Vektor

Vektor adalah struktur data paling dasar di R. Vektor adalah sekumpulan elemen yang memiliki tipe data yang sama, seperti angka, karakter, atau logika. Vektor dapat dibuat menggunakan fungsi c(), yang berarti combine atau concatenate. Contoh pembuatan vektor:

vektor_angka <- c(1, 2, 3, 4, 5)      # Vektor angka
vektor_karakter <- c("A", "B", "C")   # Vektor karakter
vektor_logika <- c(TRUE, FALSE, TRUE)  # Vektor logika

Mengakses elemen vektor:

vektor_angka[1]   # Mengakses elemen pertama (1)
#> [1] 1
vektor_karakter[2] # Mengakses elemen kedua ("B")
#> [1] "B"

Vektor bisa berupa vektor numerik, vektor karakter, atau vektor logika, tergantung tipe data elemen yang ada di dalamnya.

Matriks

Matriks adalah struktur data dua dimensi, yang berarti memiliki baris dan kolom. Semua elemen dalam matriks harus memiliki tipe data yang sama, seperti vektor. Contoh pembuatan matriks:

matriks <- matrix(1:6, nrow = 2, ncol = 3)  # Matriks 2x3 dengan elemen dari 1 hingga 6
print(matriks)
#>      [,1] [,2] [,3]
#> [1,]    1    3    5
#> [2,]    2    4    6

Data Frame

Data frame adalah struktur data yang lebih kompleks dan sering digunakan dalam analisis data. Data frame terdiri dari kolom-kolom yang dapat memiliki tipe data yang berbeda (numerik, karakter, logika, dll.), mirip dengan tabel dalam basis data atau spreadsheet. Contoh pembuatan data frame:

df <- data.frame(
  Nama = c("John", "Alice", "Bob"),
  Umur = c(25, 30, 22),
  Status = c("Single", "Married", "Single")
)
print(df)
#>    Nama Umur  Status
#> 1  John   25  Single
#> 2 Alice   30 Married
#> 3   Bob   22  Single

List

List adalah struktur data yang paling fleksibel di R. List dapat menyimpan berbagai jenis objek yang berbeda dalam satu struktur data, termasuk vektor, matriks, data frame, atau bahkan fungsi. Contoh pembuatan list:

daftar <- list(
  Nama = "John",
  Umur = 25,
  Nilai = c(90, 85, 88)
)
print(daftar)
#> $Nama
#> [1] "John"
#> 
#> $Umur
#> [1] 25
#> 
#> $Nilai
#> [1] 90 85 88

Vektor

Faktor adalah tipe data di R yang digunakan untuk menyimpan data kategorikal. Faktor menyimpan data dalam bentuk level yang dapat digunakan untuk analisis kategorikal, seperti dalam model regresi atau analisis statistik lainnya. Contoh pembuatan faktor:

status <- factor(c("Single", "Married", "Single", "Divorced"))
print(status)
#> [1] Single   Married  Single   Divorced
#> Levels: Divorced Married Single

Berikut adalah perbandingan antara berbagai struktur data di R:

Struktur Data Deskripsi Contoh Penggunaan
Vektor Sekumpulan elemen dengan tipe data yang sama Menyimpan data numerik atau karakter
Matriks Struktur dua dimensi (baris dan kolom) Menyimpan data dalam bentuk tabel numerik
Data Frame Tabel dua dimensi dengan tipe data berbeda Menyimpan data observasi dan variabel
List Koleksi elemen dengan tipe data yang berbeda Menyimpan objek dengan tipe data campuran
Faktor Data kategorikal dengan level yang terbatas Mengelompokkan data kategorikal

Fungsi dan Pemrograman di R

R menyediakan berbagai cara untuk mendefinisikan dan menggunakan fungsi dalam pemrograman. Fungsi adalah blok kode yang dirancang untuk melakukan tugas tertentu, menerima input, dan memberikan output. Pemrograman berbasis fungsi memungkinkan pengguna untuk menulis kode yang lebih modular dan terstruktur, yang memudahkan pemeliharaan dan pengembangan program.

Definisi Fungsi

Fungsi di R dibuat menggunakan kata kunci function(). Fungsi ini dapat menerima satu atau lebih argumen dan menghasilkan nilai output. Contoh pembuatan fungsi:

# Fungsi untuk menghitung kuadrat suatu angka
kuadrat <- function(x) {
  return(x^2)   # Mengembalikan nilai kuadrat dari x
}

Pemanggilan fungsi

hasil <- kuadrat(5)  # Memanggil fungsi 'kuadrat' dengan argumen 5
print(hasil)          # Output: 25
#> [1] 25

Argumen fungsi

Fungsi di R dapat menerima berbagai jenis argumen, yang bisa berupa variabel, nilai tetap, atau objek lain. Argumen juga bisa diberikan nilai default, yang berarti fungsi tetap dapat dipanggil meskipun beberapa argumen tidak diberikan nilai. Contoh argumen dengan nilai default:

# Fungsi untuk menghitung hasil pembagian
bagi <- function(a, b = 2) {
  return(a / b)  # Jika b tidak diberikan, akan menggunakan nilai default 2
}

print(bagi(10))   # Output: 5 (10 dibagi 2)
#> [1] 5
print(bagi(10, 5)) # Output: 2 (10 dibagi 5)
#> [1] 2

Fungsi dengan Beberapa Nilai Kembalian

Fungsi di R dapat mengembalikan lebih dari satu nilai. Salah satu cara untuk melakukan ini adalah dengan menggunakan list. Fungsi dapat mengembalikan objek yang lebih kompleks, seperti list, untuk menyimpan beberapa hasil sekaligus. Contoh fungsi dengan beberapa nilai kembalian:

hasil_operasi <- function(a, b) {
  hasil_penjumlahan <- a + b
  hasil_perkalian <- a * b
  return(list(penjumlahan = hasil_penjumlahan, perkalian = hasil_perkalian))
}

output <- hasil_operasi(4, 5)
print(output$penjumlahan)  # Output: 9
#> [1] 9
print(output$perkalian)    # Output: 20
#> [1] 20

Fungsi Bawaan di R

R menyediakan banyak fungsi bawaan untuk melakukan berbagai tugas, seperti manipulasi data, analisis statistik, dan visualisasi. Fungsi-fungsi ini sangat berguna dan sering digunakan dalam berbagai analisis. Contoh fungsi bawaan:

# Fungsi untuk menghitung rata-rata
rata_rata <- mean(c(1, 2, 3, 4, 5))  # Output: 3
print(rata_rata)
#> [1] 3

Fungsi Anonim

Fungsi anonim adalah fungsi yang tidak memiliki nama. Fungsi jenis ini sering digunakan dalam operasi sementara atau dalam konteks tertentu, seperti dalam operasi dengan apply atau pemrograman berbasis vektor. Contoh fungsi anonim:

# Menggunakan fungsi anonim dalam apply
angka <- c(1, 2, 3, 4, 5)
hasil <- sapply(angka, function(x) x^2)  # Menerapkan fungsi untuk menghitung kuadrat
print(hasil)  # Output: 1 4 9 16 25
#> [1]  1  4  9 16 25

Semua perintah yang telah dijelaskan di atas juga dapat digunakan pada widget interaktif di seluruh buku ini. Anda dapat mencobanya di bawah ini.