ANALISIS SENTIMEN ULASAN APLIKASI WATTPAD DI GOOGLE PLAY STORE DENGAN METODE RANDOM FOREST

Penulis

  • Safira Nur Adhan Universitas Halu Oleo
  • Gusti Ngurah Adhi Wibawa
  • Dian Christien Arisona
  • Irma Yahya
  • Ruslan Ruslan

DOI:

https://doi.org/10.33772/anoatik.v2i1.32

Abstrak

Wattpad merupakan salah satu aplikasi dan situs komunitas daring yang memungkinkan pengguna menulis atau membaca konten informasi dalam lingkup sastra dengan berbagai genre atau kategori seperti cerita pendek, klasik, aksi, petualangan, romansa, fantasi, humor, spiritual, misteri, horor, puisi, fiksi ilmiah, fiksi sejarah, fiksi remaja, fiksi umum, fiksi penggemar, dan non fiksi. Hingga Desember 2023, 90 juta pengguna menghabiskan lebih dari 23 miliar menit mengakses aplikasi ini setiap bulannya. Penelitian ini bertujuan untuk memberikan gambaran sentimen pengguna sekaligus mengklasifikasikannya sebagai teks sentimen negatif atau positif menggunakan metode Random Forest dan Random Forest yang di optimasi dengan SMOTE (Synthetic Minority Oversampling Technique) pada ulasan pengguna Aplikasi Wattpad yang mengalami ketidakseimbangan kelas. Hasil penelitian menunjukkan bahwa dari 9.975 hasil pengumpulan data, hanya 8.743 data yang dapat digunakan dengan persentase sentimen positif sebesar 64,2% (5.616) dan 35,8% (3.127) sentimen negatif. Metode Random Forest tanpa optimasi SMOTE cenderung lebih unggul dalam memprediksi klasifikasi sentimen yang tidak seimbang, ini dapat dilihat dari nilai akurasi yang mencapai 84,05%, presisi 84,71%, recall 91,60%, F1-Score 88,02%, FPR 8,40%, dan nilai AUC 0,9166 yang dikategorikan sebagai klasifikasi yang sangat baik. Pemodelan SMOTE Random Forest mampu meningkatkan kemampuan untuk mengklasifikasikan kelas minoritas yakni sentimen negatif, dapat dilihat dari naiknya nilai presisi dari dari 84,71% ke 86,70% (1,99%). Sayangnya, penyeimbangan kelas ini berdampak pada penurunan performa akurasi, recall, f1-score dan nilai AUC. Selain itu, berdasarkan nilai feature importance, fitur yang paling berpengaruh pada kedua model adalah atribut kata “kecewa”, “bagus”, dan “baik”.

Kata Kunci:

Wattpad, Analisis Sentimen, Random Forest, SMOTE

Unduhan

Data unduhan belum tersedia.

Referensi

Statista, "Web Developers: primary source of improvement feedback," accessed December 12, 2023. [Online]. Available: https://www.statista.com/statistics/271544/web-developer-survey-most-important-sources-for-identifying-site.

BrightLocal, "93% of online consumers read reviews before making a purchase or downloading an app," accessed December 12, 2023. [Online]. Available: https://www.brightlocal.com/research/local-consumer-review-survey/

B. Liu, Sentiment Analysis: Mining Opinions, Sentiments, and Emotions. Cambridge, UK: Cambridge University Press, 2015.

M. R. Pribadi, D. Manongga, H. D. Purnomo, I. Setyawan, and Hendry, "Sentiment Analysis of the PeduliLindungi on Google Play using the Random Forest Algorithm with SMOTE," ISITIA 2022-Proceeding, pp. 115-119, 2022.

Media Indonesia, "7 Rekomendasi Aplikasi Novel Gratis yang Bisa Bikin Cuan," accessed April 28, 2024. [Online]. Available: https://mediaindonesia.com/humaniora/633350/7-rekomendasi-aplikasi-novel-gratis-bisa-bikin-cuan.

N. Wulansari, "Pengaruh Penggunaan Aplikasi Wattpad Terhadap Kemampuan Menulis Naskah Drama," in Seminar Nasional Bahasa dan Sastra Indonesia, 2018.

SimilarWeb, "Wattpad," accessed December 12, 2023. [Online]. Available: https://www.similarweb.com/website/wattpad.com.

S. I. Nurhafida and F. Sembiring, "Analisis Sentimen Aplikasi Novel Online Di Google Play Store Menggunakan Algoritma Support Vector Machine (SVM)," J. Sains Komput. & Informatika (J-SAKTI), vol. 6, no. 1, pp. 317-327, 2022.

F. A. Larasati, D. E. Ratnawati, and B. T. Hanggara, "Analisis Sentimen Ulasan Aplikasi Dana dengan Metode Random Forest," J. Pengemb. Teknol. Inf. Dan Ilmu Komput., vol. 6, no. 9, pp. 4305-4313, 2022.

T. Bouabana-Tebibel and S. H. Rubin, Theoretical Information Reuse and Integration. Switzerland: Springer, 2016.

E. Renata and M. Ayub, "Penerapan Metode Random Forest untuk Analisis Risiko pada Dataset Peer to Peer Lending," J. Tek. Inform. Dan Sist. Inf., vol. 6, no. 3, pp. 462-474, 2020.

E. Fitri, Y. Yuliani, and W. Gata, "Analisis Sentimen Terhadap Aplikasi Ruangguru Menggunakan Algoritma Naive Bayes, Random Forest, dan Support Vector Machine," J. Transformatika, vol. 88, no. 1, pp. 71-80, 2020.

M. Syukron, R. Santoso, and T. Widiharih, "Perbandingan Metode SMOTE Random Forest dan SMOTE XGBoost untuk Klasifikasi Tingkat Penyakit Hepatitis C pada Imbalance Class Data," J. Gaussian, vol. 9, no. 3, pp. 227-236, 2020.

E. Erlin, Y. Desnelita, N. Nasution, L. Suryati, and F. Zoromi, "Dampak SMOTE terhadap Kinerja Random Forest Classifier berdasarkan Data Tidak Seimbang," J. Manaj., Tek. Inform. Dan Rekayasa Komput., vol. 21, no. 3, pp. 677-690, 2022.

[M. R. Nugraha, M. D. Purbolaksono, and W. Astuti, "Sentiment Analysis on Movie Review from Rotten Tomatoes Using Modified Balanced Random Forest Method and Word2Vec," Building of Informatics, Technology and Science (BITS), vol. 5, no. 1, pp. 153-161, 2023.

[16] A. Santoso, "Rumus Slovin: Panacea Masalah Ukuran Sampel?" Suksma J. Psikol. Univ. Sanata Dharma, vol. 4, no. 2, pp. 24-43, 2023.

A. Baita and N. Cahyono, "Analisis Sentimen Mengenai Vaksin Sinovac Menggunakan Algoritma Support Vector Machine (SVM) dan K-Nearest Neighbor (KNN)," Infos, vol. 4, no. 2, pp. 42-42, 2021.

Wattpad, "Pusat Bantuan," accessed March 8, 2024. [Online]. Available: https://support.wattpad.com/hc/id.

D. G. Kleinbaum and M. Klein, Statistics for Biology and Health: Logistical Regression. New York, NY, USA: Springer, 2010.

Unduhan

Diterbitkan

2024-06-20

Cara Mengutip

Nur Adhan, S., Wibawa, G. N. A., Arisona, D. C., Yahya, I., & Ruslan, R. (2024). ANALISIS SENTIMEN ULASAN APLIKASI WATTPAD DI GOOGLE PLAY STORE DENGAN METODE RANDOM FOREST. AnoaTIK: Jurnal Teknologi Informasi Dan Komputer, 2(1), 6–15. https://doi.org/10.33772/anoatik.v2i1.32

Terbitan

Bagian

Artikel