Alhamdulillah, akhirnya saya dinyatakan lulus dalam Tugas Akhir yang saya ambil di semester 8 ini. Dan Alhamdulillah saya bisa lulus tepat waktu yaitu 4 tahun. Judul TA saya: Perbandingan Kinerja Pohon Keputusan ID3 dan C4.5 dalam Identifikasi Kelayakan Kredit. Saya dapat ide utk memakai metode pohon keputusan saat saya kuliah semester 6 ketika mengikuti mata kuliah Data Mining dengan dosen Pak Mulaab. Pada waktu itu belum terpikirkan studi kasus yang saya ambil. Sampai akhirnya saya pilih studi kasus untuk mengidentifikasi kelayakan kredit di suatu leasing.
Dalam TA saya ini saya memakai 100 data survey dimana data tersebut akan dipartisi menjadi 3 bagian, yaitu partisi 70 data training : 30 data testing, 50 data training : 50 data testing dan 30 data training : 70 data testing.
Metode C4.5 yang digunakan ada 3 yaitu C4.5 (tanpa pruning), C4.5 pre pruning dan C4.5 post pruning. Perbandingan kinerja diukur dengan menghitung nilai presisi, recall dan akurasi.
Oke, berikut perbandingan kedua algoritma tersebut:
Grafik Precision:
Grafik Recall:
Grafik Accuracy:
Kesimpulan:
Dari pengukuran kinerja kedua algoritma yang telah dilakukan, dapat disimpulkan algoritma C4.5 memiliki kinerja (precision, recall, dan accuracy) yang lebih baik dibandingkan algoritma ID3. Pada umumnya, algoritma C4.5 memiliki nilai tertinggi pada partisi data 70:30, sedangkan ID3 memiliki nilai tertinggi rata-rata pada partisi data 30:70 dan pada partisi data 50:50 kedua algoritma mengalami penurunan akurasi.
Metode post pruning merupakan metode pruning yang lebih baik daripada pre pruning, hal ini dapat dilihat pada partisi data 70:30 dan partisi data 30:70 dimana post pruning memiliki nilai yang lebih baik daripada pre pruning. Partisi data 30:70 merupakan partisi terbaik karena memiliki nilai precision, recall, dan accuracy yang paling tinggi daripada partisi lainnya.