Machine Learning – di dunia yang semakin canggih ini, perkembangan teknologi kian tumbuh dengan pesat. Seperti yang kita ketahui, banyak teknologi memiliki kemampuan yang cerdas. Teknologi yang mampu berfikir dan mengambil keputusan layaknya manusia.
Teknologi tersebut biasa disebut dengan kecerdasan buatan (AI). Saat ini, banyak perusahaan industri berlomba-lomba mengembangkan bisnisnya menggunakan teknologi AI (Artificial Intelligence) untuk meningkatkan performa bisnis, kenyamanan pelanggan, data statistik, dan masih banyak lagi.
Pada artikel kali ini, kita akan membahas lebih lengkap tentang salah satu bagian dari AI (Artificial Intelligence) yaitu Machine Learning. Sudah tidak sabar? yuk, langsung simak penjelasannya dibawah.
Apa itu Machine Learning?
Machine Learning adalah ilmu yang mempelajari tentang algoritma komputer yang bisa mengenali pola-pola didalam data, dengan tujuan untuk mengubah bermacam-macam data menjadi suatu tindakan yang nyata dengan sedikit mungkin campur tangan manusia.
Machine Learning mampu mengubah pemanfaatan ilmu statistika. Artinya, kamu dapat menciptakan mesin komputer yang mampu “belajar” dari data yang ada, mengunakan teknik statistika untuk menghasilkan suatu model otomatis dari sekumpulan data. Selanjutnya, dia membuat keputusan secara mandiri tanpa perlu diprogram lagi. Machine learning adalah salah satu cabang dari AI (Artificial Intelligence).
Seseorang yang bekerja dalam bidang machine learning biasanya disebut sebagai Machine Learning Engineer. Pekerjaan yang berhubungan dengan rekayasa perangkat lunak yang menerapkan algoritma machine learning sehingga bisa bekerja pada lingkungan produksi.
Tipe Machine Learning
Secara umum terdapat 4 teknik pembelajaran dalam machine learning, yaitu Supervised learning, Unsupervised learning, Semi-supervised learning, dan Reinforced learning (Makosvkaja, 2018).
1. Supervised learning
Supervised learning adalah algoritma machine learning yang dalam proses belajarnya membutuhkan serangkaian contoh input-output yang benar, sebagai supervisor (pengawas/pelatih). Pembuatan mesin yang dilatih dengan tujuan mencapai output seperti (kelas/label) yang diinginkan, seperti input dimana output yang diinginkan telah diketahui.
Supervised learning biasanya digunakan dalam aplikasi dimana data historis memprediksi kemungkinan peristiwa di masa depan. Sebagai contoh, hal ini dapat mengantiipasi ketika transaksi kartu kredit kemungkinan penipuan atau pelanggan asuransi mana yang akan mengajukan klaim.
Algoritma Supervised Learning ini sendiri juga dibagi lagi menjadi beberapa jenis algoritma tergantung dari task/tujuan dibentuknya algoritma, antara lain:
- Klasfikasi: Logistik Regression, Decision Trees, Random Forest, KNN, SVM, Neural Networks, Naive bayes, dll.
- Prediksi Numerik/Regresi: Linear Regression, Decission Trees, Neural Networks, SVM, Trees, dll.
2. Unsupervised learning
Berbeda dengan supervised learning, Unsupervised learning dalam proses belajarnya, algoritma hanya diberikan sejumlah sampel masukan tanpa label (output yang benar). Sehingga dengan algoritma ini, tidak ada supervisor yang membantu dalam menentukan kinerja dan output yang dihasilkan benar atau salah.
Tujuan dari teknik pembelajaran ini adalah untuk mengeksplorasi data dan menemukan beberapa struktur didalamnya. Salah satu contoh pembelajaran unsupervisor learning biasanya disebut dengan pengelompokan dimana menemukan kesamaan dalam data pelatihan, sebuah metode yang biasa digunakan adalah kluster.
Untuk macam-macam algoritma unsupervised sendiri antara lain berdasarkan task atau tujuan algoritmanya:
- Klustering: K-Means Clustering, Hierarchical Clustering
- Association: Association Rules
3. Semi-supervised learning
Apa itu semi-supervised learning? suatu algoritma yang dipakai dalam melakukan pembelajaran, baik melalui data yang memiliki label ataupun yang tidak memiliki label. Sistem yang memakai jenis algoritma ini bisa meningkatkan efisiensi pada output yang dihasilkan.
Biasanya, semi-supervised learning digunakan data berlabel dalam jumlah kecil dan data tidak dilabeli dalam jumlah besar. Metode machine learning ini dapat digunakan dengan metode lainnya seperti klasifikasi, regresi, dan prediksi. Contoh penggunaan semi-supervised learning adalah untuk proses identifikasi wajah seseorang pada webcam atau kamera smartphone.
4. Reinforcement learning
Pada reinforcement learning, terdapat dua komponen utama yaitu agent dan environment. Di algoritma pembelajaran ini, agent dipaksa untuk dengan sendirinya mempelajari bagaimana ia harus bertindak menghadapi environment-nya untuk mencapai tujuannya. Disini tidak ada kumpulan dataset yang diberikan seperti supervised learning dan unsupervised learning.
Tujuan dari reinforcement learning adalah untuk menggunakan observasi yang dikumpulkan dari interaksi bersama lingkungan guna mengambil tindakan yang akan memaksimumkan ouput dan meminimalkan resiko. Algoritma ini akan terus belajar secara berulang-ulang.
Dalam algoritma ini, ada agen yang akan belajar dari interaksi degnan environmentnya. Untuk menghasilkan model, algoritma reinforcement learning melalui berapa tahap antara lain agent mengamati data input, setelah itu agen melakukan suatu tindakan untuk mengambil keputusan.
Setelah keputusan diambil, agen akan memperoleh reward, atau penguatan dari lingkungan . Lalu kembali mengamati inpu dan prose pengambilan keputusan kembali dilakukan. Namun dengan tambahan penguatan dari lingkungan sehingga hasil keputusan yang diambil lebih akurat.
Hubungan machine learning, data science, data analytics dan data mining
Data science adalah ilmu multidisipliner yang mempelajari tentang upaya mendapatkan pemahaman yang lebih dari berbagai macam data. Tujuannya adalah mendapatkan kesimpulan dari informasi yang terkandung didalam data, sehingga orang dapat mengambil keputusan tindakan yang tepat.
Data science memiliki lingkup yang lebih luas dibanding data analytics. Data analytics lebih berfokus pada pemecahan permasalahan atau menjawab pertanyaan tertentu yang spesifik. Data analytics berusaha memberikan kesimpulan dari apa yang sudah diketahui sebelumnya.
Selain kedua ilmu tentang data tersebut, ada pula yang namanya data mining. Data mining adalah ilmu yang mempelajari tentang metode untuk menghasilkan pengetahuan tentang mengenali pola-pola dari data yang berjumlah besar, yang bila menggunakan mata manusia belaka akan sulit diteliti.
Biasanya, apabila kamu mengerjakan data mining, maka kemungkinan besar kamu akan memerlukan metode-metode machine learning. Kebalikannya, machine learning bisa jadi memerlukan data mining untuk mendapatkan data yang sesuai keperluannya.
Cara kerja machine learning
Machine learning memiliki cara kerja berupa riset dan algoritma yang akan menemukan pola yang bisa melakukan suatu prediksi. Berikut beberapa tahapan machine learning, yaitu:
1. Pemilahan data
Machine learning memang sistem yang mengandalkan data, mulai training data, validation data dan test data. Jadi, jika kamu memiliki data tertentu dan butuh eksekusi, maka machine learning bisa menjadi salah satu opsi.
2. Model data dan validasi model
Kamu wajib membangun model dengan fitur yang sesuai dengan tujuan machine learning lewat model data. Lakukan validasi model atau pengujian terhadap model data yang telah disiapkan untuk mendapatkan input proses dan output.
3. Test model dan penggunaannya
Test data adalah perbandingan kinerja model yang telah divalidasi data prediksi, lalumengaplikasikan data yang sudah terlatih dengan menciptakan prediksi data baru.