Berikut ini sedikit penjelasan terkait
contoh-contoh dari algoritma yang telah disebutkan di atas. Logistic Regression Algoritma ini biasa digunakan untuk menghitung
nilai probabilitas, sehingga output yang dihasilkan berada antara nilai 0
hingga 1. Contoh penggunaannya adalah proses pengajuan kredit di bank. Biasanya
pihak bank akan mengajukan sejumlah pertanyaan/kuisioner untuk menilai
kelayakan calon penerima kredit. Dari beberapa pertanyaan itulah nantinya pihak
bank akan memperhitungkan probabilitas calon penerima kredit akan mengembalikan
pinjaman atau tidak. Decision Trees Algoritma jenis ini melakukan tugasnya dengan
menggunakan konsep struktur flowchart bercabang menggunakan decision rules atau
aturan-aturan keputusan yang dibuat oleh desainernya. Random Forest Random Forest merupakan kumpulan dari sejumlah
Decision Tree. Oleh karena itu, prinsip dasar random forest mirip dengan
decision tree. Masing-masing decision tree akan menghasilkan output (hasil)
yang bisa saja berbeda-beda. Nah, random forest ini akan melakukan voting untuk
menentukan hasil mayoritas dari semua decision tree. Bedanya, random forest akan memberikan output
berupa mayoritas hasil dari semua decision tree. Pusing ya? Mungkin bisa
dilihat di ilustrasinya biar lebih jelas. K-Nearest Neighbors (KNN) Seperti telah sedikit disinggung di tulisan
sebelumnya, KNN pada prinsipnya akan mengklasifikasikan data baru ke kelas
tertentu berdasarkan jarak data baru tersebut dengan k data terdekat. Support Vector Machine (SVM) Algoritma ini pada dasarnya dapat digunakan untuk
melakukan pengelompokan pada algoritma multidimensi. SVM mengelompokkan data
menggunakan apa yang disebut sebagai hyperplane (classifier/pemisah). Neural Network Algoritma jenis ini terinspirasi dari cara kerja
jaringan saraf manusia. Oleh karena itu, arsitektur dari algoritma ini mirip
dengannya. Secara garis besar, di algoritma ini tiap data pada suatu “layer”
akan diolah dan diteruskan ke “layer” berikutnya hingga ke layer terakhir
(layer output). Naive Bayes Algoritma ini menggunaan prinsip teorema Bayes.
Sehingga pada proses pengolahan data, masing-masing feature (feature itu
semacam parameter, dalam kasus klasifikasi Iris, features-nya antara lain
adalah panjang dan lebar sepal dan petal) dianggap independen atau tidak
terkait satu sama lain. Linear Regression Sebagai ilustrasi, pada grafik dua dimensi,
algoritma ini melakukan task prediksi suatu nilai variabel dependent di sumbu y
berdasarkan variabel independent di sumbu x. Pusing ya? K-Means Clustering Seperti namanya, algoritma ini biasa digunakan
untuk kasus clustering. Cara kerja algoritma ini mula-mula adalah dengan
membentuk sejumlah k titik, yang disebut dengan centroid (dimana nilai k
merepresentasikan jumlah cluster). Kemudian titik-titik data (data points) yang
ada akan membentuk cluster dengan centroid terdekat darinya. Otomatis, titik
pusat (centroid) akan berubah seiring dengan pertambahan anggota tiap
cluster-nya (yang mana adalah datapoints tadi). Oleh karena itu, tiap-tiap
cluster yang telah terbentuk akan ‘mencari’ titik centroid barunya. Proses ini
terus menerus dilakukan hingga diperoleh kondisi konvergensi, contohnya jika
posisi centroid sudah tidak berubah. Hierarchical Clustering Secara prinsip, hierarchical clustering ini akan
melakukan clustering secara berjenjang berdasarkan kemiripan tiap data.
Sehingga pada akhirnya, pada ujung hierarki akan terbentuk cluster-cluster yang
karakteristiknya berbeda satu sama lain, dan objek di satu cluster yang sama
memiliki kemiripan satu sama lain. Association Rules Prinsip algoritma ini dalam melakukan tugasnya
adalah dengan menemukan probabilitas hubungan asosiasi antar data Itu tadi beberapa algoritma machine learning yang
cukup sering digunakan (atau setidaknya yang saya pelajari haha). Tentunya
masih banyak lagi algoritma-algoritma lainnya yang belum disebutkan. Tetapi
semoga gambaran garis besar algoritma-algoritma ML ini bisa membantu pembaca
dalam menentukan tipe algoritma mana yang harus dipakai ketika menyelesaikan
suatu masalah.
Algoritma yang dipakai
tentunya disesuaikan dengan tujuan pemakaiannya. Bisa jadi suatu masalah dapat
diselesaikan tidak hanya dengan satu algoritma saja. Semua algoritma memiliki
kelemahan dan kelebihannya masing-masing. Oleh karena itu, kita dapat
memilah-milah atau mengkombinasikan beberapa algoritma dalam menyelesaikan
masalah untuk memperoleh hasil yang maksimal. |