Analisis Sentimen Pengguna Twitter tentang LGBTQ di Indonesia Menggunakan Algoritma Naive Bayes dan Logistic Regression (LR)
Repositori ini berisi program untuk melakukan analisis sentimen terhadap tweet pengguna Twitter mengenai topik LGBTQ di Indonesia. Proyek ini menggunakan dua algoritma Naive Bayes dan Logistic Regression (LR) untuk mengklasifikasikan sentimen tweet menjadi dua kategori: positif dan negatif. Selain itu, proyek ini juga menunjukkan bagaimana proses pembersihan data, pemrosesan teks, dan evaluasi model dilakukan.
- Preprocessing Teks:
- Tokenisasi, penghapusan stopwords, dan stemming pada data tweet.
- Penggunaan TF-IDF Vectorizer untuk mengonversi teks menjadi representasi numerik.
- Model Klasifikasi:
- Implementasi dua algoritma, Naive Bayes dan Logistic Regression (LR), untuk klasifikasi sentimen.
- Evaluasi Model:
- Penggunaan metrik seperti akurasi, precision, recall, dan F1-score untuk mengevaluasi kinerja model.
- Visualisasi hasil evaluasi menggunakan confusion matrix.