KLASIFIKASI LIRIK LAGU MELALUI SPEECH-TO-TEXT DENGAN INDOBERT MULTICLASS CLASSIFICATION DAN LLAMA3:70B

2107411002, Michael Natanael (2025) KLASIFIKASI LIRIK LAGU MELALUI SPEECH-TO-TEXT DENGAN INDOBERT MULTICLASS CLASSIFICATION DAN LLAMA3:70B. D4 thesis, Politeknik Negeri Jakarta.

[thumbnail of Halaman Identitas Skripsi & Pembukaan (Bab 1) dan Penutup (Bab 5)] Text (Halaman Identitas Skripsi & Pembukaan (Bab 1) dan Penutup (Bab 5))
Halaman Identitas Skripsi & Pembukaan (Bab 1) dan Penutup (Bab 5).pdf

Download (4MB)
[thumbnail of Isi (Bab 2 Tinjauan Pustaka, Bab 3 Metode Penelitian, dan Bab 4 Hasil dan Pembahasan)] Text (Isi (Bab 2 Tinjauan Pustaka, Bab 3 Metode Penelitian, dan Bab 4 Hasil dan Pembahasan))
Isi (Bab 2 Tinjauan Pustaka, Bab 3 Metode Penelitian, dan Bab 4 Hasil dan Pembahasan).pdf
Restricted to Hanya Civitas Akademika PNJ

Download (3MB)
[thumbnail of Manuskrip Artikel Ilmiah (Jurnal)] Text (Manuskrip Artikel Ilmiah (Jurnal))
Manuskrip Artikel Ilmiah (Jurnal).pdf
Restricted to Hanya Staff Repositori

Download (894kB)

Abstrak

Popularitas lagu-lagu Indonesia di media sosial dan layanan streaming telah menimbulkan kekhawatiran terkait lirik yang tidak sesuai usia, terutama dampaknya terhadap perilaku dan emosi anak-anak dan remaja. Oleh karena itu, diperlukan pengembangan model yang mampu mengklasifikasikan lirik lagu Indonesia ke dalam empat kategori usia pendengar: anak-anak, remaja, dewasa, dan semua usia. Penelitian terdahulu telah melakukan klasifikasi lirik lagu Indonesia berdasarkan kategori usia menggunakan algoritma Naïve Bayes Classifier (NBC), menghasilkan hasil yang kurang memuaskan dengan akurasi 65%. Penelitian ini mengusulkan metode baru yang menggabungkan Large Language Model (LLM), khususnya LLAMA3:70B untuk meningkatkan kinerja klasifikasi dan memperluas jumlah dataset hingga 1000%. Tiga strategi augmentasi dataset diterapkan dalam metode ini, yaitu zero-shot, sample-based, dan translation-based. Performa klasifikasi berhasil ditingkatkan secara signifikan melalui model terbaik hasil fine-tune IndoBERT multiclass classification dengan pendekatan sample-based, yang mencapai F1 macro score sebesar 74%. Model ini kemudian diimplementasikan dalam bentuk aplikasi web yang dilengkapi dengan fitur speech-to-text dengan Whisper-Large-V3. Hasil pengujian menunjukkan bahwa akurasi klasifikasi mencapai 75% pada benchmark dataset. Hasil evaluasi usability menunjukkan nilai System Usability Scale (SUS) sebesar 78,21 dan Net Promoter Score (NPS) sebesar 45%.

Tipe Dokumen: Thesis / Skripsi / Tugas Akhir (D4)
Subjek: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 000 Ilmu komputer, informasi dan pekerjaan umum
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 004 Pemrosesan data dan ilmu komputer
000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Bidang, Unit, atau Jurusan Yang Ditujukan: Teknik Informatika dan Komputer > Teknik Informatika D4
User ID Pengunggah: Michael Natanael
Date Deposited: 09 Jul 2025 07:36
Last Modified: 09 Jul 2025 07:36
URI: https://repository.pnj.ac.id/id/eprint/26837

Actions (login required)

View Item
View Item