Abstract
Penelitian ini bertujuan untuk mengaplikasikan Deep Reinforcement Learning (DRL) sebagai solusi untuk sistem rekomendasi streaming musik. DRL mempunyai kelebihan yaitu dapat memecahkan dua masalah utama dalam sistem rekomendasi, sehingga cocok untuk memaksimalkan kepuasan pengguna dan mempertahankan penggunaan pada jangka waktu panjang. Sistem rekomendasi musik yang dibangun akan berdasarkan update musik terakhir yang didengarkan oleh pengguna dengan cara mencari kemiripan dari fitur musik dengan selera pengguna terhadap musik tersebut. Selanjutnya, pada penelitian ini akan digunakan Deep Deterministic Policy Gradient (DDPG) sebagai metode DRL untuk memecahkan permasalahan sulitnya mengumpulkan data pengguna baru dan berubahnya selera pengguna dari waktu ke waktu. Pada perkembangannya, DRL merupakan kombinasi dari deep learning dan Reinforcement learning. Reinforcement Learning (RL) adalah cabang dari machine learning dimana pembelajaran yang dilakukan melalui eksperimen interaksi dengan lingkungan. RL merupakan metode pembelajaran yang goal-oriented dimana mesin dapat memilih action sendiri yang dipilih berdasarkan goal tersebut. Dalam perkembangan ilmu terbaru, dalam pembelajarannya RL dikombinasikan dengan Deep Learning dan disebut sebagai Deep Reinforcement Learning (DRL). DLR dapat digunakan pada sistem yang secara konstan terus berubah polanya. DRL ini merupakan kunci dari smart technology, di mana mesin yang dikembangkan dapat belajar dan mengambil action sendiri. Di lain pihak, pada era digital ini dibutuhkan Recommender System (RS) pada aplikasi streaming musik agar dapat bersaing dengan aplikasi lain. RS adalah perangkat lunak dan teknik yang dapat menyediakan rekomendasi mengenai produk tertentu kepada pengguna. Dengan mengembangkan Music Recommender System, maka aplikasi streaming tersebut dapat memberikan rekomendasi musik yang beragam dan relevan bagi setiap pengguna. Akan tetapi ada dua masalah utama dalam RS, yaitu sulitnya mengumpulkan data dari pengguna baru dan adanya perubahan selera pengguna dari waktu ke waktu. Untuk memecahkan kedua permasalahan ini, kami mengusulkan penerapan Deep Reinfocement Learning sehingga dapat memecahkan permasalahan pada RS dengan mengarahkan pengumpulan data dan adaptasi model sesuai dengan tujuannya. Target luaran dari penelitian ini adalah publikasi berupa buku referensi, jurnal internasional terindeks Scopus, hak cipta dari perangkat lunak. Sebagai penelitian dasar dari bidang deep reinforcement learning maka TKT dari penelitian ini termasuk dalam tahap dasar, yaitu TKT 2. Target akhir TKT penelitian ini adalah TKT 3 yang direncanakan dicapai dalam waktu dua tahun.