PENGEMBANGAN KASUS KORUPSI BERBASIS WEB PEMETAAN MENGGUNAKAN MACHINE LEARNING DENGAN ARTIFICIAL NEURAL NETWORK

Penafsiran definisi korupsi sangat bergantung pada aspek pribadi seperti waktu, lokasi, dan disiplin ilmu. Berbagai definisi dari berbagai sumber bisa jadi ditemukan. Jain, mencirikan korupsi sebagai perilaku ketika kekuatan publik digunakan untuk mendapatkan keuntungan pribadi sementara bertentangan dengan aturan. Namun Madsen, berdebat dalam konteks yang lebih dalam dan lebih luas sebagai kondisi dimana seseorang diberikan insentif untuk melakukan sesuatu yang seharusnya tidak dia lakukan, atau tidak melakukan apa yang dia lakukan harus dilakukan sesuai dengan hukum dan peraturan. Dari semua definisi, yang paling komprehensif, universal, dan mampu mendefinisikan korupsi dengan cara terbaik adalah dari Transparansi Internasional (TI) yang mendefinisikan korupsi sebagai tindakan penyalahgunaan memberikan kekuasaan untuk mendapatkan keuntungan pribadi, karena konsep tersebut dibebaskan korupsi membatasi hanya di lembaga pemerintah, dan itu tidak hanya memperhitungkan pembatasan yuristik tetapi juga memungkinkan aturan tidak tertulis dari nilai moral dan etika yang akan dimasukkan definisi.

 Korupsi di Indonesia

Padahal kasus korupsi lebih sering terjadi ditemukan di negara berkembang di negara maju, itu jauh dari yang benar untuk membedakannya dari masalah global. Korupsi adalah risiko kemajuan internasional dan bahkan disebutkan oleh G8 sebagai risiko keamanan. Di Indonesia, 8 dari 10 WNI mengatakan bahwa korupsi telah menyebar luas di negara ini, dengan 91% mengatakan bahwa itu berasal dari sektor pemerintah dan 86% mengatakan itu Berasal dari sektor bisnis. Persepsi warga ini didukung oleh laporan dari berbagai perusahaan publik yang mengaku menghabiskan lebih dari 10% waktu dan pengeluaran mereka – yang dapat mereka gunakan dalam aspek produktif lainnya, dalam menyuap pejabat pemerintah. Laporan tersebut menyatakan bahwa suap sangat penting bagi perusahaan mempercepat urusan bisnis dan administrasi mereka dengan local pejabat. Survei antikorupsi nasional yang dilakukan oleh Indonesia Corruption Watch (ICW) menjelaskan publik itu sektor yang mereka anggap paling korup adalah: pemerintah perekrutan karyawan (56%), polisi (50%), pengadaan barang dan layanan dari kantor pemerintah (48%), dan pengadilan (45%).

Berita media tentang korban korupsi tidak sebanyak dan teraba seperti kejahatan lain seperti perampokan atau seksual pelecehan, tetapi tidak berarti jumlah korbannya remeh, juga tidak berarti bahwa konsekuensinya ringan. Mengacu pada laporan tahunan ICW 2016, jumlah korupsi kasus di Indonesia dari awal hingga akhir tahun 2016 mencapai 238 kasus, dengan total kerugian negara mencapai 1 Triliun Rupiah atau sekitar 70.000.000 USD pada tahun 2016 saja. Terlihat lebih menonjol ketika perspektifnya dilebarkan semua kerugian negara sebelumnya diperhitungkan. Hingga 2016, kerugian total Korupsi di Indonesia mencapai angka 209,3 Triliun Rupiah, atau mendekati 15 Miliar USD.

Jumlah uang itu bisa digunakan untuk membangun 600 Rumah Sakit dengan internasional standar, untuk meluluskan 546.000 sarjana dalam negeri atau 45.500 Ph.D di luar negeri, untuk pembebasan biaya jaminan sosial (BPJS) untuk semua Warga negara Indonesia, atau membangun lebih dari 10.000 km jalan raya atau 202 km MRT. Sangat penting untuk focus pencegahan korupsi secepatnya dan melawannya sekuat tenaga mungkin karena setiap hari berlalu dengan tidak semestinya dan strategi yang tidak efisien untuk memerangi korupsi, semakin banyak dana Negara hilang.

Melihat besarnya kerugian yang disebabkan oleh korupsi, banyak solusi telah dipikirkan oleh semua pilar pemerintah: legislatif, eksekutif, dan yudikatif. Itu solusi berkisar dari mencegah korupsi dengan meningkatkan pendidikan tentang korupsi dan penerapan e-government, hingga menuntut pelaku korupsi dengan membentuk Komisi Pemberantasan Korupsi (KPK). Sayangnya, tidak banyak solusi yang melibatkan teknologi, khususnya Teknologi Informasi. Memperhatikan Kapabilitas Teknologi Informasi yang sangat luas, sangat menguntungkan untuk memanfaatkan kekuatan itu untuk menangani masalah sebesar korupsi.

Sebagian besar solusi dapat dipikirkan di berbagai bidang Teknologi Informasi, dan pembelajaran mesin adalah salah satunya disiplin ilmu paling populer di Teknologi Informasi. Dengan data melimpah yang mudah diakses dengan menggunakan internet, pembelajaran mesin adalah alat yang ampuh untuk mencegah korupsi. Sementara pembelajaran mesin juga dapat membantu proses penuntutan korupsi, pekerjaan ini akan difokuskan pada membantu korupsi upaya pencegahan dengan memberikan informasi berharga tentang perbandingan antar provinsi di Indonesia.

Aplikasi yang diuraikan dalam pekerjaan ini diharapkan dapat membantu pemangku kepentingan terkait dan pengambil keputusan dalam korupsi mereka tindakan pencegahan. Ini menangkap konten berita dari 7 bahasa Indonesia situs berita, mengklasifikasikan setiap konten sebagai bagian dari berita tentang kasus korupsi atau tidak, dan memvisualisasikannya dalam bentuk peta geografis menggunakan Google API. Ruang lingkup pekerjaan ini adalah terbatas pada menyajikan aplikasi web yang sudah jadi, seperti sebelumnya pekerjaan ekstensif dilakukan untuk menentukan algoritme terperinci proses dari pemrosesan teks, hingga klasifikasi konten.

Kerangka teoritis dari aplikasi yang dikembangkan adalah dimulai dengan mengumpulkan berita artikel sebagai data primer untuk diolah. Isinya adalah dikumpulkan dengan terlebih dahulu menggunakan program web crawling, dilanjutkan dengan penggalian informasi menggunakan program web-scraping. Itu isi yang dikikis diproses sebelumnya, untuk dipersiapkan proses klasifikasi menggunakan Jaringan Syaraf Tiruan dengan Metode propagasi mundur. Artikel berita rahasia itu kemudian dihitung sebagai masukan untuk aplikasi web. Sebelumnya penelitian telah mengeksplorasi proses klasifikasi korupsi kasus menggunakan Naïve Bayes, N-Gram, dan Tabel Hash, tapi ini pekerjaan dilakukan dengan menggunakan JST untuk mengeksploitasi pasokan yang melimpah data.

Pengumpulan sumber data

Data yang digunakan sebagai sumber dalam aplikasi web diperoleh menggunakan perayapan web dan pengikisan web. Perayapan digunakan untuk merayapi dari satu halaman ke halaman lain, mengikuti setiap link di dalam halaman. Database akan menyimpan hasil perayapan sebagai indeks. Selanjutnya, indeks yang disimpan akan dihapus dengan mengumpulkan dan mengekstrak konten, diikuti dengan memasukkannya ke dalam database. Proses ini akan diulangi berulang kali setelah setiap indeks yang diperoleh pada fase perayapan. Untuk mengeksekusi perayapan dan scraping, kami menggunakan Penjadwalan Cron untuk terus berjalan perintah perayapan dan pengikisan secara berkala. Untuk ini bekerja, proses perayapan dan pengikisan dilakukan sekali per menit. Ini mempertimbangkan proses internal perayapan dan pengikisan membutuhkan waktu sekitar 20-40 detik.

Konten berita dikumpulkan dari 7 situs berita utama di Indonesia: liputan6.com, tribunnews.com, merdeka.com, kompas.com, detik.com, dan tempo.co. Alasan yang mendasari pemilihan berita didasarkan pada beberapa pertimbangan mengenai: (1) kualitas website yang ditandai dengan Alexa yang baik pangkat; (2) Kualitas isi berita ditunjukkan dengan cukup penjelasan tentang 5W dan 1H; (3) aksesibilitas untuk merangkak dan scraping, ditunjukkan dengan memiliki peta situs dan mengizinkan robot / perayap untuk merayapi konten web; dan (4) dapat diakses sejak setidaknya 2010, untuk mempertahankan kesamaan di kisaran konten, dan untuk memastikan tersedia jangka waktu yang cukup.

Pekerjaan ini menggunakan Artificial Neural Network (ANN) sebagai algoritma pilihan untuk mengklasifikasikan konten bersama dengan metode propagasi mundur. Tujuan klasifikasi adalah untuk menentukan apakah setiap berita berbicara tentang korupsi, atau apakah memang benar tidak. Alasan memilih JST dengan propagasi mundur adalah karena kemampuannya untuk mengatur penyambungan gradien bobotnya setiap node untuk setiap iterasi yang dilakukan, menghasilkan lebih sedikit deviasi keluaran karena terus melatih data. Input untuk JST adalah sekantong kata, yaitu jumlah numerik kemunculan untuk multi-set kata dalam dokumen. Setiap kata sesuai dengan satu simpul masukan, membuat total lebih dari 3000 node input untuk model JST saat ini. Itu keluaran JST akan menjadi 2 kelas: korupsi, dan non- korupsi. Fungsi Aktivasi Sigmoid digunakan untuk menerjemahkan masukan linier menjadi keluaran non-linier karena menunjukkan yang tertinggi akurasi dibandingkan dengan Tanh dan ReLu.

Mengatasi masalah berat sebesar korupsi itu tidak mudah, dan harus didukung oleh teknologi. Aplikasi web yang digunakan memetakan korupsi berdasarkan jumlah pemberitaan di area masing-masing dibuat. Aplikasi web dapat ditampilkan peta visual kasus korupsi di Indonesia. Wilayahnya bisa dilihat setinggi per provinsi, atau sedetail per kota dan kabupaten. Aplikasi web dikembangkan dengan menggunakan kombinasi pembelajaran mesin menggunakan Artificial Neural Network (ANN) untuk memproses klasifikasi berita dan web korupsi teknologi untuk bertindak sebagai media visualisasi. Tertinggi akurasi model JST adalah 96.91% dengan menggunakan Sigmoid fungsi aktivasi. Tujuan dari aplikasi ini adalah untuk mewakili indeks korupsi per daerah di Indonesia dengan mudah-mudahan akan memungkinkan pengambilan keputusan yang lebih obyektif dan program yang lebih efektif untuk mengurangi kasus korupsi.

 

Pekerjaan ini didukung oleh Direktorat Jenderal Riset dan Penguatan Pembangunan, Kementerian RI Riset, Teknologi, dan Pendidikan Tinggi, sebagai bagian dari Hibah Penelitian Kelembagaan Strategis Nasional untuk Binus Universitas dengan judul “Pengembangan Sistem Pemetaan Kasus Korupsi Berdasarkan Indeks Persepsi Korupsi Dengan Menggunakan Teknik Text Mining “atau “The Development of Pemetaan Kasus Korupsi Berdasarkan Persepsi Korupsi Indeks menggunakan Text Mining ” dengan nomor kontrak: 024 / KM / PNT / 2018 dan tanggal kontrak: 6 Maret 2018.

Buku Bacaan:

[1] R. Pradiptyo, T. H. Partohap and Pramashavira, “Korupsi Struktural;
Analisis Database Korupsi Versi 4 (2001-2015),” 5 April 2016. [Online].
Available: http://cegahkorupsi.feb.ugm.ac.id/publikasi-
/Database%20Korupsi%20V%204-5April16_RP_VR_THP.pdf.
[Accessed September 2016].
[2] S. Rose-Ackerman and B. J. Palifka, Corruption and Government:
Causes, Consequences, and Reform, 2nd ed., Cambridge: Cambridge
University Press, 2016.
[3] A. K. Jain, “Corruption: A review,” Journal of Economic Surveys, vol.
15, no. 1, pp. 71-122, 2001.

[4] U. Sommer , P. B.-N. Bloom and G. Arikan, “Does faith limit immorality?
The politics of religion and corruption,” Democratization, vol. 20, no. 2,
pp. 287-309, 2013.
[5] F. G. Madsen, “Corruption: A global common evil,” The RUSI Journal,
vol. 158, no. 2, pp. 26-38, 2013.
[6] Transparency International, “Slow, Imperfect Progress Across Asia
Pacific,” 21 February 2018. [Online]. Available:
https://www.transparency.org/news/feature/slow_imperfect_progress_ac
ross_asia_pacific. [Accessed 21 May 2018].
[7] B. A. Olken and R. Pande, “Corruption in developing countries,” Scholars
at HARVARD, 2011.
[8] Gallup International, “Corruption Continues to Plague Indonesia,” 2018.

[Online]. Available: http://news.gallup.com/poll/157073/corruption-
continues-plague-indonesia.aspx. [Accessed 21 May 2018].

[9] J. V. Henderson and A. Kuncoro, “Corruption in Indonesia,” National
Bureau of Economic Research, pp. 1-38, 2004.
[10] Indonesia Corruption Watch, “Survei Nasional Anti Korupsi,” 26 July
2017. [Online]. Available:
https://antikorupsi.org/sites/default/files/files/Kajian/Temuan%20Hasil%
20Survey%20Anti%20Korupsi%202017.pdf. [Accessed 21 May 2018].
[11] Indonesia Corruption Watch, “Annual Report 2016 Indonesia Corruption
Watch – Menyemai Semangat Antikorupsi,” June 2017. [Online].
Available:
https://antikorupsi.org/sites/default/files/Laporan%20Akhir%20Tahun%
20ICW%202016.pdf. [Accessed 21 May 2018].
[12] E. P. Bolongaita, U4 Issue, vol. 4, Utstein: U4, 2010.
[13] J. C. Bertot, P. T. Jaeger and J. M. Grimes, “Using ICTs to create a culture

of transparency: E-government and social media as openness and anti-
corruption tools for societies,” Government information quarterly, vol. 27,

no. 3, pp. 264-271, 2010.
[14] D. A. Pratomo and R. Kriyantono, “The Power of Media Effect:
Construction Television as Media for Anti-Corruption Education in
Indonesia,” KKU International Journal of Humanities and Social
Sciences, vol. 6, no. 1, pp. 1-9, 2016.
[15] Neupane, A., Soar, J., & Vaidya, K. “The potential of e-procurement
technology for reducing corruption,” International Journal of Information
Technology and Management, vol 11 no. 4, pp 273-287. 2012.
[16] Neu, D., Everett, J., & Rahaman, A. S. “Preventing corruption within
government procurement: Constructing the disciplined and ethical
subject,” Critical Perspectives on Accounting, vol 28, pp. 49-61.
[17] Transparency International, “Technology Against Corruption,” 8 May
2013. [Online]. Available:
https://www.transparency.org/news/feature/technology_against_corrupti
on. [Accessed 22 June 2018].
[18] Noerlina, L. A. Wulandhari, Sasmoko, A. M. Muqsith and M. Alamsyah,
“Corruption Cases Mapping Based on Indonesia’s Corruption Perception
Index,” Journal of Physics: Conference Series, vol. 801, no. 1, pp. 12-19,
2017.
[19] Noerlina, L. A. Wulandhari, Y. Arifin, S. M. A. Andi and M. Alamsyah,
“Corruption system development based on Indonesia’s corruption
perception index,” ICIC Express Letters, Part B: Applications, vol. 9, no.
2, pp. 155-162, 2018.

 

Prof.Dr. Ir Sasmoko, M.Pd