Abstract
Pada era modern ini, manusia semakin bergantung pada teknologi komputer. Dimanapun kita berada, teknologi komputer selalu ada di sekitar kita, mulai dari kantong kita hingga tempat kerja kita. Teknologi komputer tersebut dapat melakukan pekerjannya dengan sangat baik. namun lambat laun, kita sebagai makhluk sosial akan menuntut lebih dari teknologi komputer tersebut. Dimana kita akan menuntut agar alat-alat tersebut dapat mengerti kita dalam berinteraksi. Untuk dapat membangun sistem yang dapat mengerti kita, maka kita membutuhkan data yang sangat besar serta metode algoritma yang handal untuk mengolah data tersebut. Machine learning memberikan proses yang sama dengan cara kita mengajar seseorang. Pada dasarnya, terdapat kumpulan data-data yang telah diberi label, yang kita sebut sebagai dataset, yang kemudian kita gunakan sebagai sumber pengetahuan untuk mengajar/training komputer. Sampai sekarang ini masih jarang sekali dataset yang berisikan data-data untuk mengajar komputer untuk dapat berinteraksi secara natural. Ditambah lagi, jikapun ada dataset tersedia, maka sangat jarang dataset tersebut berbahasa Indonesia.
Keywords
machine learning, Indonesian dataset, teknologi komputer, interaksi natural.