Jumat, 20 Juli 2012

Data Mining: Studi Kasus(2) Teknik Klasifikasi

Bagaimana cara implementasi data mining untuk teknik klasifikasi pada algoritma C4.5 ??. Seperti penjelasan teori sebelumnya tentang apa itu data mining data yang akan diolah untuk teknik ini merupakan dari data sebelumnya/histori/pengalaman. Hal ini dibuat untuk digunakan pengambilan keputusan untuk kejadian yang akan datang. Data yang diolah saat ini akan dijadikan model patokan guna keputusan selanjutnya. 

Data yang digunakan untuk bisa menjadi sebuah model yang baik idealnya mencukupi sebagai data riset. Semakin banyak data dan semakin sedikit kesalahan(error) maka semakin bagus model yang dijadikan patokan.

Teknik data mining yang akan diproses menggunakan sebuah Tools seperti RapidMiner, Weka dsb. Perhitungan algoritma akan proses/dilakukan secara otomatis oleh Tools tersebut.Oleh karena itu, untuk mengetahui algoritma sesungguhnya dilakuan perhitungan secara manual(lihat contoh disini)


Data pegawai dari suatu perusahaan.
Pegawai
Jabatan
Jenis Kelamin
Umur
Asal
Kategori
Gaji
1
service
Perempuan
45
Kota Besar
Level-3
2
service
Laki-laki
25
Kota Besar
Level-1
3
service
Laki-laki
33
Kota Kecil
level-2
4
Manajemen
Laki-laki
25
Kota Besar
Level-3
5
Manajemen
Perempuan
35
Kota Kecil
Level-4
6
Manajemen
Laki-laki
26
Kota Kecil
Level-3
7
Manajemen
Perempuan
45
Kota Besar
Level-4
8
Sales
Perempuan
40
Kota Kecil
Level-3
9
Sales
Laki-laki
30
Kota Besar
level-2
10
Staf
Perempuan
50
Kota Besar
level-2
11
Staf
Laki-laki
25
Kota Kecil
Level-1

Langkah-langkah untuk membuat decision tree(pohon keputusan) dari data diatas
Menggunakan software : RapidMiner
1.       Buka software rapidminer
2.       File - new
3.       Pilih direktori penyimpanan di : NewLocalrepository, kemudian berikan nama file “datakaryawan” kemudian klik OK
4.       Maka tampil main process
5.       Dibagian tab sebelah kiri ada tab operator, pilih Import - data - Read Excel
Hal ini digunakan untuk mengimport data kita. Ada berbagai macam pilihan disesuaikan dengan data yang kita punya(dalam hal ini menggunakan excel)
Lalu Klik and drag “Read Excel” tersebut kedalam Main Process
6.     Masih dalam keadaan terseleksi(untuk Read Excel) lihat di bagian sebelah kanan ada tab parameters
Klik Import Configuration Wizard
7.       Kemudian tampil jendela import wizard - pilih direktori dimana file datakaryawan disimpan == next
8.       Langkah selanjutnya adalah pemilihan range data mana saja yang akan diimport. Dalam hal ini semuanya maka klik Next - Next
9.       Dilangkah ini, tentukan label dan tipe data untuk setiap atribut
*keterangan
Polynom               = tipe data ini untuk karakter baik angka ataupun huruf (sama seperti varchar/text)
Binominom           = tipe data ini untuk 2 kategori (Y/T, L,P, Besar/Kecil, dll)
Atribut                 = digunakan sebagai variable predictor/prediksi
Label                    = digunakan sebagai variable tujuan

10.   Klik finish dan kembali ke main process
11.   Ambil data yang telah diimport melalui wizard tadi di tab operator, ketik decision tree pada bagian filter
 12.   Kemudian klik and drag “decision tree” ke main process
13.   Kemudian klik and drag “out” (pada Read Excel) KE “tra”(pada decision tree)
14.   Kemudian klik and drag “mod” (pada decision tree) KE “res” disebelah kanan main process
15.   Klik process - run atau klik pada toolbar
16.   Maka akan tampil decision tree seperti dibawah ini


 Untuk lebih jelasnya silakan download langkahnya dalam bentuk PDF disini










4 komentar:

rahmah suci mengatakan...

kita juga punya nih jurnal mengenai Data Mining , silahkan dikunjungi dan dibaca , berikut linknya

http://repository.gunadarma.ac.id/bitstream/123456789/486/1/Data%20Mining%20Discretization%20Methods%20and%20Performances.pdf
semoga bermanfaat yaa :)

Thank you for ur comment... by Razbie
Obat Penyakit Syaraf Kejepit mengatakan...

Keren banget informasinya nih.

Thank you for ur comment... by Razbie
Obat Pemulihan Setelah Kuret mengatakan...

Terima kasih atas informasinya

obat serangan jantung mendadak
cara pengobatan luka bakar tersiram air panas
obat diabetes paling tepat
cara mengobati penyakit kelenjar payudara
obat asam lambung paling tepat
cara mengobati biduran
cara mengobati tipes
pengobatan gusi bengkak
pengobatan bronkhitis pada anak
gejala diabetes dan penyebabnya
obat tradisional maag untuk ibu hamil
obat mual untuk ibu hamil
obat demam anak balita
cara mengobati radang gusi
kadar gula dalam darah
obat pemulihan setelah kuret
obat amandel anak tanpa operasi
obat kolesterol untuk ibu hamil
obat tumor untuk ibu hamil
obat penambah berat badan ibu menyusui
obat gondongan pada anak

Thank you for ur comment... by Razbie
Moh Nugroho Wibowo mengatakan...

ijin share ilmu pohon keputusan yg pernah saya pelajari di http://nugikkool.blogspot.co.id/2012/08/pohon-keputusan-id3-dan-c45-menggunakan.html
juga ada implementasi program pohon keputusan di php, perhitungan manual, penjelasan pruning, dll. semoga bermanfaat.

Thank you for ur comment... by Razbie

Poskan Komentar