Abstract
Penelitian ini bertujuan untuk mengaplikasikan Deep Reinforcement Learning (DRL) sebagai solusi untuk sistem rekomendasi streaming musik . DRL mempunyai kelebihan yaitu dapat memecahkan dua masalah utama dalam sistem rekomendasi, sehingga cocok untuk memaksimalkan kepuasan pengguna dan mempertahankan penggunaan pada jangka waktu panjang. Sistem rekomendasi musik yang dibangun akan berdasarkan update musik terakhir yang didengarkan oleh pengguna dengan cara mencari kemiripan dari fitur musik dengan selera pengguna terhadap musik tersebut. Selanjutnya, pada penelitian ini akan digunakan Deep Deterministic Policy Gradient (DDPG) sebagai metode DRL untuk memecahkan permasalahan sulitnya mengumpulkan data pengguna baru dan berubahnya selera pengguna dari waktu ke waktu. Pada perkembangannya, DRL merupakan kombinasi dari deep learning dan Reinforcement learning. Reinforcement Learning (RL) adalah cabang dari machine learning dimana pembelajaran yang dilakukan melalui eksperimen interaksi dengan lingkungan. RL merupakan metode pembelajaran yang goal-oriented dimana mesin dapat memilih action sendiri yang dipilih berdasarkan goal tersebut. Dalam perkembangan ilmu terbaru, dalam pembelajarannya RL dikombinasikan dengan Deep Learning dan disebut sebagai Deep Reinforcement Learning (DRL). DLR dapat digunakan pada sistem yang secara konstan terus berubah polanya. DRL ini merupakan kunci dari smart technology, di mana mesin yang dikembangkan dapat belajar dan mengambil action sendiri.