Halaman

Jumat, 20 Juli 2012

Data Mining: Studi Kasus(2) Teknik Klasifikasi

Bagaimana cara implementasi data mining untuk teknik klasifikasi pada algoritma C4.5 ??. Seperti penjelasan teori sebelumnya tentang apa itu data mining data yang akan diolah untuk teknik ini merupakan dari data sebelumnya/histori/pengalaman. Hal ini dibuat untuk digunakan pengambilan keputusan untuk kejadian yang akan datang. Data yang diolah saat ini akan dijadikan model patokan guna keputusan selanjutnya. 

Data yang digunakan untuk bisa menjadi sebuah model yang baik idealnya mencukupi sebagai data riset. Semakin banyak data dan semakin sedikit kesalahan(error) maka semakin bagus model yang dijadikan patokan.

Teknik data mining yang akan diproses menggunakan sebuah Tools seperti RapidMiner, Weka dsb. Perhitungan algoritma akan proses/dilakukan secara otomatis oleh Tools tersebut.Oleh karena itu, untuk mengetahui algoritma sesungguhnya dilakuan perhitungan secara manual(lihat contoh disini)


Data pegawai dari suatu perusahaan.
Pegawai
Jabatan
Jenis Kelamin
Umur
Asal
Kategori
Gaji
1
service
Perempuan
45
Kota Besar
Level-3
2
service
Laki-laki
25
Kota Besar
Level-1
3
service
Laki-laki
33
Kota Kecil
level-2
4
Manajemen
Laki-laki
25
Kota Besar
Level-3
5
Manajemen
Perempuan
35
Kota Kecil
Level-4
6
Manajemen
Laki-laki
26
Kota Kecil
Level-3
7
Manajemen
Perempuan
45
Kota Besar
Level-4
8
Sales
Perempuan
40
Kota Kecil
Level-3
9
Sales
Laki-laki
30
Kota Besar
level-2
10
Staf
Perempuan
50
Kota Besar
level-2
11
Staf
Laki-laki
25
Kota Kecil
Level-1

Langkah-langkah untuk membuat decision tree(pohon keputusan) dari data diatas
Menggunakan software : RapidMiner
1.       Buka software rapidminer
2.       File - new
3.       Pilih direktori penyimpanan di : NewLocalrepository, kemudian berikan nama file “datakaryawan” kemudian klik OK
4.       Maka tampil main process
5.       Dibagian tab sebelah kiri ada tab operator, pilih Import - data - Read Excel
Hal ini digunakan untuk mengimport data kita. Ada berbagai macam pilihan disesuaikan dengan data yang kita punya(dalam hal ini menggunakan excel)
Lalu Klik and drag “Read Excel” tersebut kedalam Main Process
6.     Masih dalam keadaan terseleksi(untuk Read Excel) lihat di bagian sebelah kanan ada tab parameters
Klik Import Configuration Wizard
7.       Kemudian tampil jendela import wizard - pilih direktori dimana file datakaryawan disimpan == next
8.       Langkah selanjutnya adalah pemilihan range data mana saja yang akan diimport. Dalam hal ini semuanya maka klik Next - Next
9.       Dilangkah ini, tentukan label dan tipe data untuk setiap atribut
*keterangan
Polynom               = tipe data ini untuk karakter baik angka ataupun huruf (sama seperti varchar/text)
Binominom           = tipe data ini untuk 2 kategori (Y/T, L,P, Besar/Kecil, dll)
Atribut                 = digunakan sebagai variable predictor/prediksi
Label                    = digunakan sebagai variable tujuan

10.   Klik finish dan kembali ke main process
11.   Ambil data yang telah diimport melalui wizard tadi di tab operator, ketik decision tree pada bagian filter
 12.   Kemudian klik and drag “decision tree” ke main process
13.   Kemudian klik and drag “out” (pada Read Excel) KE “tra”(pada decision tree)
14.   Kemudian klik and drag “mod” (pada decision tree) KE “res” disebelah kanan main process
15.   Klik process - run atau klik pada toolbar
16.   Maka akan tampil decision tree seperti dibawah ini


 Untuk lebih jelasnya silakan download langkahnya dalam bentuk PDF disini










» Read more → Data Mining: Studi Kasus(2) Teknik Klasifikasi