Tugas Akhir, Jurusan Sistem Informasi, Fakultas Ilmu Komputer, Universitas Gunadarma, 2008.
Kata Kunci : Decision Tree, ID3, C4.5, Klasifikasi, Spam-mail, Weka.
( x + 44)
Klasifikasi spam mail digunakan untuk memisahkan antara spam-mail dengan non spam mail (atau yang biasa disebut ham atau legitimate mail). Klasifikasi spam mail ini berguna untuk menghemat waktu dan penghematan biaya yang digunakan untuk menghapus spam mail dari inbox. Untuk itu diperlukan metode yang paling baik untuk mengklasifikasikan spam mail. Algoritma decision tree merupakan salah satu metode yang bisa digunakan untuk klasifikasi spam mail. Algoritma decision tree telah banyak mengalami pengembangan. Algoritma ID3 dan C4.5 adalah salah satu pengembangan dari algoritma decision tree. Penelitian ini membandingkan kinerja dari dua algoritma tersebut.
Tujuan dari penelitian ini adalah membandingkan kinerja kedua algoritma yang dimiliki oleh algoritma ID3 dan algoritma C4.5, dalam mengklasifikasikan spam mail. Dari perbandingan ini akan diketahui persentase precision, recall dan accuracy dari data yang digunakan.
Data yang digunakan adalah data yang diambil dari UCI Machine Learning Repository berjumlah 4601 data email yang terdiri dari 1813 email spam dan 2788 email non-spam. Data yang diambil akan diubah menjadi data katergori dengan teknik distribusi frekuensi. Dengan menggunakan alat bantu WEKA (Waikato Environment for Knowledge Analysis) 3-4 yang digunakan untuk menguji algoritma ID3 dan c4.5.
Dari pengukuran kinerja algoritma ID3 dan C4.5 bahwa algoritma ID3 memiliki kinerja yang lebih baik dibandingkan algoritma C4.5.
Daftar Pustaka ( 2003-2008)
0 Response to "PERBANDINGAN KINERJA ALGORITMA ID3 DAN C4.5 DALAM MENGKLASIFIKASIKAN SPAM-MAIL"
Post a Comment