
KLASIFIKASI TOPIK BERITA POLITIK MENGGUNAKAN MODEL LOGISTIC REGRESSION DAN FITUR BAG OF WORDS
DOI:
https://doi.org/10.69916/jkbti.v4i3.375Keywords:
klasifikasi berita, logistic regression, bag of words, politik, machine learningAbstract
Penelitian ini bertujuan mengembangkan model klasifikasi topik berita politik yang efisien dan interpretable untuk mengatasi tantangan pengelolaan informasi di era digital. Pendekatan ini memanfaatkan algoritma Logistic Regression yang dipadukan dengan representasi fitur Bag of Words (BoW) untuk mengotomatisasi proses pengelompokan berita. Model diimplementasikan menggunakan bahasa pemrograman Python. Proses dimulai dari pengumpulan dataset berita berbahasa Indonesia, dilanjutkan dengan preprocessing teks (case folding, tokenisasi, penghapusan stopwords, dan stemming). Representasi teks dilakukan dengan metode Bag of Words, kemudian data dibagi menjadi 80% untuk pelatihan dan 20% untuk pengujian. Model Logistic Regression dilatih dan dievaluasi menggunakan metrik akurasi, presisi, recall, F1-score, MSE, dan RMSE. Model menunjukkan performa yang kuat dengan akurasi 84% dan F1-score rata-rata 0,84 pada enam kategori topik (politik, ekonomi, hiburan, olahraga, bisnis, teknologi). Pada klasifikasi biner (Politik vs Non-Politik), model mencapai akurasi sempurna 100% dengan MSE dan RMSE 0,00. Visualisasi fitur mengonfirmasi bahwa model mampu mengidentifikasi kata kunci politik seperti “pemilu” dan “partai” secara konsisten. Penelitian membuktikan bahwa kombinasi Logistic Regression dan BoW merupakan solusi yang efektif, efisien, dan transparan untuk klasifikasi berita politik. Meskipun hasilnya sangat akurat, potensi overfitting akibat ukuran dataset yang kecil (215 sampel) perlu menjadi pertimbangan untuk pengembangan model di masa depan.
Downloads
References
B. Imran, M. N. Karim, and N. I. Ningsih, “Klasifikasi Berita Hoax Terkait Pemilihan Umum Presiden Republik Indonesia Tahun 2024 Menggunakan Naïve Bayes Dan Svm,” Din. Rekayasa, vol. 20, no. 1, pp. 1–9, 2024, doi: 10.20884/1.dinarek.2024.20.1.27.
J. Indrawan, R. E. Barzah, and H. Simanihuruk, “Instagram sebagai media komunikasi politik bagi generasi milenial,” Ekspresi dan Persepsi J. Ilmu Komun., vol. 6, no. 1, pp. 170–179, 2023.
A. R. Hanum et al., “Analisis Kinerja Algoritma Klasifikasi Teks Bert dalam Mendeteksi Berita Hoaks,” J. Teknol. Inf. dan Ilmu Komput., vol. 11, no. 3, pp. 537–546, 2024, doi: 10.25126/jtiik.938093.
I Putu Gede Hendra Suputra, Linawati, I. G. Sukadarmika, and N. P. Sastra, “Klasifikasi Judul Berita Bahasa Indonesia Menggunakan Support Vector Machine Dan Seleksi Fitur Mutual Information,” J. Pendidik. Teknol. dan Kejuru., vol. 22, no. 1, pp. 69–79, 2025, doi: 10.23887/jptkundiksha.v22i1.89158.
M. Zamzam, M. A. Kurniawan, and K. Khoiri, “Habaib Di Pusaran Kekuasaan: Studi Tentang Dinamika Politik Dan Agama Di Indonesia,” al-Akmal J. Stud. Islam, vol. 3, no. 5, pp. 9–20, 2024.
D. B. W. Alfredo Gormantara, “KLASIFIKASI KATEGORI DAN PELABELAN BERITA BAHASA INDONESIA MENGGUNAKAN MUTUAL INFORMATION DAN K- NEAREST NEIGHBORS,” J. Temat., vol. 8, pp. 75–82, 2020.
R. Permana and F. A. Herdiana, “Analisis Klasifikasi Dan Prediksi Pola Publikasi Berita Pemprov DKI Jakarta Menggunakan Machine Learning,” J. Infortech, vol. 7, no. 1, 2025.
L. F. Chasanah and E. W. Pamungkas, “Klasifikasi Subjektif Berita Menggunakan Algoritma Machine Learning,” in Proceeding of Informatics Collaborations and Dessimenation Meeting, 2025, pp. 140–143.
Normah, B. Rifai, S. Vambudi, and R. Maulana, “Analisa Sentimen Perkembangan Vtuber Dengan Metode Support Vector Machine Berbasis SMOTE,” J. Tek. Komput. AMIK BSI, vol. 8, no. 2, pp. 174–180, 2022, doi: 10.31294/jtk.v4i2.
M. Fahmuddin, M. K. Aidid, and M. J. Taslim, “Implementasi Analisis Regresi Logistik Dengan Metode Machine Learning Untuk Mengklasifikasi Berita Di Indonesia,” VARIANSI J. Stat. Its Appl. Teach. Res., vol. 5, no. 03, pp. 155–162, 2023, doi: 10.35580/variansiunm116.
Guruh Wijaya, Dudi Irawan, Zainul Arifin, Hardian Oktavianto, Miftahur Rahman, and Ginanjar Abdurrahman, “Studi Klasifikasi Topik Berita Dengan Algoritma Machine Learning,” J-Ensitec, vol. 11, no. 01, pp. 10202–10206, 2024, doi: 10.31949/jensitec.v11i01.12037.
N. E. Juliana, F. D. Khansa, A. M. H. Azis, R. I. Gunawan, and N. D. Cahya, “Klasifikasi Kategori Berita menggunakan Algoritma Support Vector Machine,” Gunung Djati Conf. Ser., vol. 3, 2021.
I. F. Ramadhy and Y. Sibaroni, “Analisis Trending Topik Twitter dengan Fitur Ekspansi FastText Menggunakan Metode Logistic Regression,” JURIKOM (Jurnal Ris. Komputer), vol. 9, no. 1, p. 1, 2022, doi: 10.30865/jurikom.v9i1.3791.
A. Ananta Firdaus, A. Id Hadiana, and A. Kania Ningsih, “Klasifikasi Sentimen pada Aplikasi Shopee Menggunakan Fitur Bag of Word dan Algoritma Random Forest,” Ranah Res. J. Multidiscip. Res. Dev., vol. 6, no. 5, pp. 1678–1683, 2024, doi: 10.38035/rrj.v6i5.994.
F. A. Wicaksono, A. Romadhony, and Hasmawati, “Sentiment Analysis of University Social Media Using Support Vector Machine and Logistic Regression Methods,” Ind. J. Comput., vol. 7, no. 2, pp. 15–24, 2022, doi: 10.34818/indojc.2022.7.2.638.
Downloads
Published
Scite Metrics
Altmetric
How to Cite
Issue
Section
License
Copyright (c) 2025 Chaidir Ali

This work is licensed under a Creative Commons Attribution 4.0 International License.