Database spam-mail ini diperoleh dari  UCI Machine Learning Repository http://www.ics.uci.edu/~mlearn/MLRepository.html. Database ini disumbangkan oleh George Forman dari laboratorium Hewlett-Packard (HP). Database terdiri dari koleksi e-mail dari bulan juni sampai juli 1999.  database terdiri dari total 4601 e-mail, dimana 1813 (39.4%) adalah spam dan 2788 (60.6%) adalah non-spam. Koleksi spam-email berasal dari HP e-mail dan spam-email individu. Koleksi non-spam email berasal dari e-mail kantor dan e-mail perseorangan.

10. BAB III
Download versi lengkapnya disini
klo Full Versi disini