2107411002, Michael Natanael (2025) KLASIFIKASI LIRIK LAGU MELALUI SPEECH-TO-TEXT DENGAN INDOBERT MULTICLASS CLASSIFICATION DAN LLAMA3:70B. D4 thesis, Politeknik Negeri Jakarta.
![[thumbnail of Halaman Identitas Skripsi & Pembukaan (Bab 1) dan Penutup (Bab 5)]](https://repository.pnj.ac.id/style/images/fileicons/text.png)
Halaman Identitas Skripsi & Pembukaan (Bab 1) dan Penutup (Bab 5).pdf
Download (4MB)
![[thumbnail of Isi (Bab 2 Tinjauan Pustaka, Bab 3 Metode Penelitian, dan Bab 4 Hasil dan Pembahasan)]](https://repository.pnj.ac.id/style/images/fileicons/text.png)
Isi (Bab 2 Tinjauan Pustaka, Bab 3 Metode Penelitian, dan Bab 4 Hasil dan Pembahasan).pdf
Restricted to Hanya Civitas Akademika PNJ
Download (3MB)
![[thumbnail of Manuskrip Artikel Ilmiah (Jurnal)]](https://repository.pnj.ac.id/style/images/fileicons/text.png)
Manuskrip Artikel Ilmiah (Jurnal).pdf
Restricted to Hanya Staff Repositori
Download (894kB)
Abstrak
Popularitas lagu-lagu Indonesia di media sosial dan layanan streaming telah menimbulkan kekhawatiran terkait lirik yang tidak sesuai usia, terutama dampaknya terhadap perilaku dan emosi anak-anak dan remaja. Oleh karena itu, diperlukan pengembangan model yang mampu mengklasifikasikan lirik lagu Indonesia ke dalam empat kategori usia pendengar: anak-anak, remaja, dewasa, dan semua usia. Penelitian terdahulu telah melakukan klasifikasi lirik lagu Indonesia berdasarkan kategori usia menggunakan algoritma Naïve Bayes Classifier (NBC), menghasilkan hasil yang kurang memuaskan dengan akurasi 65%. Penelitian ini mengusulkan metode baru yang menggabungkan Large Language Model (LLM), khususnya LLAMA3:70B untuk meningkatkan kinerja klasifikasi dan memperluas jumlah dataset hingga 1000%. Tiga strategi augmentasi dataset diterapkan dalam metode ini, yaitu zero-shot, sample-based, dan translation-based. Performa klasifikasi berhasil ditingkatkan secara signifikan melalui model terbaik hasil fine-tune IndoBERT multiclass classification dengan pendekatan sample-based, yang mencapai F1 macro score sebesar 74%. Model ini kemudian diimplementasikan dalam bentuk aplikasi web yang dilengkapi dengan fitur speech-to-text dengan Whisper-Large-V3. Hasil pengujian menunjukkan bahwa akurasi klasifikasi mencapai 75% pada benchmark dataset. Hasil evaluasi usability menunjukkan nilai System Usability Scale (SUS) sebesar 78,21 dan Net Promoter Score (NPS) sebesar 45%.
Tipe Dokumen: | Thesis / Skripsi / Tugas Akhir (D4) |
---|---|
Subjek: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data |
Bidang, Unit, atau Jurusan Yang Ditujukan: | Teknik Informatika dan Komputer > Teknik Informatika D4 |
User ID Pengunggah: | Michael Natanael |
Date Deposited: | 09 Jul 2025 07:36 |
Last Modified: | 09 Jul 2025 07:36 |
URI: | https://repository.pnj.ac.id/id/eprint/26837 |