Bagaimana cara implementasi data mining untuk teknik klasifikasi pada algoritma C4.5 ??. Seperti penjelasan teori sebelumnya tentang apa itu data mining data yang akan diolah untuk teknik ini merupakan dari data sebelumnya/histori/pengalaman. Hal ini dibuat untuk digunakan pengambilan keputusan untuk kejadian yang akan datang. Data yang diolah saat ini akan dijadikan model patokan guna keputusan selanjutnya.
Data yang digunakan untuk bisa menjadi sebuah model yang baik idealnya mencukupi sebagai data riset. Semakin banyak data dan semakin sedikit kesalahan(error) maka semakin bagus model yang dijadikan patokan.
Teknik data mining yang akan diproses menggunakan sebuah Tools seperti RapidMiner, Weka dsb. Perhitungan algoritma akan proses/dilakukan secara otomatis oleh Tools tersebut.Oleh karena itu, untuk mengetahui algoritma sesungguhnya dilakuan perhitungan secara manual(lihat contoh disini)
Data pegawai dari suatu perusahaan.
Pegawai
|
Jabatan
|
Jenis Kelamin
|
Umur
|
Asal
|
Kategori
Gaji
|
1
|
service
|
Perempuan
|
45
|
Kota Besar
|
Level-3
|
2
|
service
|
Laki-laki
|
25
|
Kota Besar
|
Level-1
|
3
|
service
|
Laki-laki
|
33
|
Kota Kecil
|
level-2
|
4
|
Manajemen
|
Laki-laki
|
25
|
Kota Besar
|
Level-3
|
5
|
Manajemen
|
Perempuan
|
35
|
Kota Kecil
|
Level-4
|
6
|
Manajemen
|
Laki-laki
|
26
|
Kota Kecil
|
Level-3
|
7
|
Manajemen
|
Perempuan
|
45
|
Kota Besar
|
Level-4
|
8
|
Sales
|
Perempuan
|
40
|
Kota Kecil
|
Level-3
|
9
|
Sales
|
Laki-laki
|
30
|
Kota Besar
|
level-2
|
10
|
Staf
|
Perempuan
|
50
|
Kota Besar
|
level-2
|
11
|
Staf
|
Laki-laki
|
25
|
Kota Kecil
|
Level-1
|
Langkah-langkah untuk membuat decision tree(pohon keputusan) dari data
diatas
Menggunakan software : RapidMiner
1.
Buka software rapidminer
2.
File - new
3.
Pilih direktori penyimpanan di :
NewLocalrepository, kemudian berikan nama file “datakaryawan” kemudian klik OK
4.
Maka tampil main process
5.
Dibagian tab sebelah kiri ada tab operator,
pilih Import - data - Read Excel
Hal ini digunakan
untuk mengimport data kita. Ada berbagai macam pilihan disesuaikan dengan data
yang kita punya(dalam hal ini menggunakan excel)
Lalu Klik and drag
“Read Excel” tersebut kedalam Main Process
6.
Masih dalam keadaan terseleksi(untuk Read Excel)
lihat di bagian sebelah kanan ada tab parameters
Klik Import
Configuration Wizard
7.
Kemudian tampil jendela import wizard - pilih direktori dimana file datakaryawan disimpan == next
8.
Langkah selanjutnya adalah pemilihan range data
mana saja yang akan diimport. Dalam hal ini semuanya maka klik Next - Next
9.
Dilangkah ini, tentukan label dan tipe data
untuk setiap atribut
*keterangan
Polynom = tipe data ini
untuk karakter baik angka ataupun huruf (sama seperti varchar/text)
Binominom = tipe data ini
untuk 2 kategori (Y/T, L,P, Besar/Kecil, dll)
Atribut = digunakan
sebagai variable predictor/prediksi
Label =
digunakan sebagai variable tujuan
10.
Klik finish dan kembali ke main process
11. Ambil data yang telah
diimport melalui wizard tadi di tab operator, ketik decision tree pada bagian
filter
12.
Kemudian klik and drag “decision tree” ke main
process
13.
Kemudian klik and drag “out” (pada Read Excel) KE “tra”(pada decision tree)
14.
Kemudian klik and drag “mod” (pada decision
tree) KE
“res” disebelah kanan main process
15.
Klik process - run atau klik pada toolbar
Untuk lebih jelasnya silakan download langkahnya dalam bentuk PDF disini