Berikut ini sedikit penjelasan terkait contoh-contoh dari algoritma yang telah disebutkan di atas.

Logistic Regression

Algoritma ini biasa digunakan untuk menghitung nilai probabilitas, sehingga output yang dihasilkan berada antara nilai 0 hingga 1. Contoh penggunaannya adalah proses pengajuan kredit di bank. Biasanya pihak bank akan mengajukan sejumlah pertanyaan/kuisioner untuk menilai kelayakan calon penerima kredit. Dari beberapa pertanyaan itulah nantinya pihak bank akan memperhitungkan probabilitas calon penerima kredit akan mengembalikan pinjaman atau tidak.

Decision Trees

Algoritma jenis ini melakukan tugasnya dengan menggunakan konsep struktur flowchart bercabang menggunakan decision rules atau aturan-aturan keputusan yang dibuat oleh desainernya.

Random Forest

Random Forest merupakan kumpulan dari sejumlah Decision Tree. Oleh karena itu, prinsip dasar random forest mirip dengan decision tree. Masing-masing decision tree akan menghasilkan output (hasil) yang bisa saja berbeda-beda. Nah, random forest ini akan melakukan voting untuk menentukan hasil mayoritas dari semua decision tree.

Bedanya, random forest akan memberikan output berupa mayoritas hasil dari semua decision tree. Pusing ya? Mungkin bisa dilihat di ilustrasinya biar lebih jelas.

K-Nearest Neighbors (KNN)

Seperti telah sedikit disinggung di tulisan sebelumnya, KNN pada prinsipnya akan mengklasifikasikan data baru ke kelas tertentu berdasarkan jarak data baru tersebut dengan k data terdekat.

Support Vector Machine (SVM)

Algoritma ini pada dasarnya dapat digunakan untuk melakukan pengelompokan pada algoritma multidimensi. SVM mengelompokkan data menggunakan apa yang disebut sebagai hyperplane (classifier/pemisah).

Neural Network

Algoritma jenis ini terinspirasi dari cara kerja jaringan saraf manusia. Oleh karena itu, arsitektur dari algoritma ini mirip dengannya. Secara garis besar, di algoritma ini tiap data pada suatu “layer” akan diolah dan diteruskan ke “layer” berikutnya hingga ke layer terakhir (layer output).

Naive Bayes

Algoritma ini menggunaan prinsip teorema Bayes. Sehingga pada proses pengolahan data, masing-masing feature (feature itu semacam parameter, dalam kasus klasifikasi Iris, features-nya antara lain adalah panjang dan lebar sepal dan petal) dianggap independen atau tidak terkait satu sama lain.

Linear Regression

Sebagai ilustrasi, pada grafik dua dimensi, algoritma ini melakukan task prediksi suatu nilai variabel dependent di sumbu y berdasarkan variabel independent di sumbu x. Pusing ya?

K-Means Clustering

Seperti namanya, algoritma ini biasa digunakan untuk kasus clustering. Cara kerja algoritma ini mula-mula adalah dengan membentuk sejumlah k titik, yang disebut dengan centroid (dimana nilai k merepresentasikan jumlah cluster). Kemudian titik-titik data (data points) yang ada akan membentuk cluster dengan centroid terdekat darinya. Otomatis, titik pusat (centroid) akan berubah seiring dengan pertambahan anggota tiap cluster-nya (yang mana adalah datapoints tadi). Oleh karena itu, tiap-tiap cluster yang telah terbentuk akan ‘mencari’ titik centroid barunya. Proses ini terus menerus dilakukan hingga diperoleh kondisi konvergensi, contohnya jika posisi centroid sudah tidak berubah.

Hierarchical Clustering

Secara prinsip, hierarchical clustering ini akan melakukan clustering secara berjenjang berdasarkan kemiripan tiap data. Sehingga pada akhirnya, pada ujung hierarki akan terbentuk cluster-cluster yang karakteristiknya berbeda satu sama lain, dan objek di satu cluster yang sama memiliki kemiripan satu sama lain.

Association Rules

Prinsip algoritma ini dalam melakukan tugasnya adalah dengan menemukan probabilitas hubungan asosiasi antar data

Itu tadi beberapa algoritma machine learning yang cukup sering digunakan (atau setidaknya yang saya pelajari haha). Tentunya masih banyak lagi algoritma-algoritma lainnya yang belum disebutkan. Tetapi semoga gambaran garis besar algoritma-algoritma ML ini bisa membantu pembaca dalam menentukan tipe algoritma mana yang harus dipakai ketika menyelesaikan suatu masalah.

Algoritma yang dipakai tentunya disesuaikan dengan tujuan pemakaiannya. Bisa jadi suatu masalah dapat diselesaikan tidak hanya dengan satu algoritma saja. Semua algoritma memiliki kelemahan dan kelebihannya masing-masing. Oleh karena itu, kita dapat memilah-milah atau mengkombinasikan beberapa algoritma dalam menyelesaikan masalah untuk memperoleh hasil yang maksimal.

 Copyright stekom.ac.id 2018 All Right Reserved