- Tugas Akhir
- Kerja
Prunning di dalam algoritma CMAR memiliki tiga langkah. Langkah paling awal adalah prunning berdasarkan rank (pengecekan confidence, support, dan panjang pattern). Langkah kedua adalah dengan menggunakan maximum chi square untuk menentukan besar keterkaitan, dan akhirnya adalah database coverage.
Sampe saat ini yang sudah gw lakukan adalah prunning langkah pertama. Dan mengalami hambatan karena ketika dicoba di data yang besar, masih ada duplikasi sampai ratusan kali. Apakah memang harus dipaksa di cek ke dalam vector patterns nya?
Progress keseluruhan seharusnya cukup baik karena pertemuan minggu lalu cukup baik akibat bertemu dua ahli sekaligus, yaitu Bu Yova dan Pak Yudo. Kalo diliat-liat kayanya gak akan ada waktu implementasi C4.5, selain tidak ada code yang langsung tempel dan juga kompleksitas dari CMAR yang cukup besar.
Dalam tahap design database dan pemahaman proses keluar masuk data yang tidak mudah untuk dipahami. Hampir seluruh tabel di dalam schema percobaan ini dalam bentuk denormal yang seharusnya dapat membuat query-query yang digunakan akan lebih mudah. Sedikit diperparah karena narasumber gw adalah auditor sehingga konsep yang dia berikan harus gw translate lagi ke dalam bentuk sistem. UC Spec yang tebalnya tidak sampai 40 halaman ini rasanya sulit sekali, tapi belum mengalahkan paper cmar gw. Hehehe.
Minggu ini harus bisa nemu query2 penting nih. Ganbatte 🙂