Apa itu data mining ?
What the mean of data mining..?? hmmm…dilihat dari pengertiannya “mining” berarti tambang/penggalian. Jadi secara makna data mining merupakan penggalian lebih untuk mendapatkan informasi yang berguna dari data yang sudah ada. Untuk apa ?? tentunya sekumpulan informasi yang kita terima dikumpulkan, dianalisa dan disimpulkan untuk memprediksi suatu permasalahan yang mungkin akan terjadi dimasa datang dan pengambilan keputusan.
Zaman dulu, mencari sebuah data dan informasi tidaklah mudah, berbeda dengan zaman sekarang sangat banyak dan begitu cepat informasi yang beredar. Tinggal search di google semua pilihan informasi tersedia, bahkan saking banyaknya kita harus pandai memilah dan memilih informasi mana yang memang kita butuhkan. Oke, itu sedikit pembuka dari saya sekarang mari kita mengenal lebih dalam apa itu data mining.. ^_^
Definisi Data Mining
Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan teknik statistic, matematika, kecerdasan buatan, dan machine elerning untuk mengekstrasi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar [Turban, 2005].
Inti dari data mining adalah kegiatan penggalian pengetahuan data. Pengertian dari istilah lain yang hampir mirip dengan data mining adalah Knowledge discovery dan pattern recognition.
*Knowledge discovery : menemukan pengetahuan dari bongkahan data yang masih tersembunyi
*pattern recognition : pengenalan pola. Pengetahuan yang digali masih berbentuk pola-pola yang mungkin masih perlu digali dalam bongkahan data
Pengelompokkan Data Mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan , yaitu
1. Deskripsi
Menggambarkan sekumpulan data secara ringkas. Data yang digambarkan berupa:
- Deskripsi grafis : diagram titik, histogram
- deskripsi lokasi : mean(rata-rata), median(nilai tengah), modus, kuartil, persentil
- Deskripsi keberagaman : range(rentang), varians dan standar deviasi
2. Estimasi
Memperkirakan suatu hal dari sejumlah sample yang kita miliki(yg tidak kita ketahui)
Estimasi hampir sama dengan klasifikasi, kecuali variable target. Estimasi lebih kearah numeric dari pada kearah kategori.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa datang(memperkirakan hal yang belum terjadi). Kita bisa menunggu hingga hal itu terjadi untuk membuktikan seberapa tepat prediksi kita
4. Klasifikasi
kegiatan menggolongkan, dengan menggunakan data historis(sebagai data yang digunakan untuk latihan dan sebagai pengalaman).Dalam klasifikasi terdapat variabel prediktor dan target variable,
5. Pengklusteran
Pengkulusteran merupakan pengelompokan record, pengamatan atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainya dan memiliki ketidak miripan dengan record-record dalam cluster.
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang biasa.
Berdasarkan pengelompokkan data mining tersebut, masing masing memiliki kelompok fungsi antara lain:
-- Fungsi Minor (tambahan) : deskripsi, estimasi, prediksi
-- Fungsi Mayor (utama) : klasifikasi, pengelompokkan, estimasi
Knowledge Discovery In Database (Penemuan Pengetahuan dalam Database)
Data mining digambarkan sebagai proses pencarian pengetahuan yang menarik dalam database seperti pola , asosiasi, aturan, perubahan, keganjilan dan struktur penting dari sejumlah besar data yang disimpan pada bank data dan tempat penyimpanan informasi lainnya. Berikut merupakan proses KDD
1. pemilihan data (data selection), pemilihan data relevan yang didapat dari basis data;
2. pembersihkan data (data cleaning), proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan;
3. pengintegrasian data (data integration), penggabungan data dari berbagai basisdata ke dalam satu basisdata baru;
4. transformasi data, data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining;
5. data mining, suatu proses di mana metoda diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data;
6. evaluasi pola (pattern evaluation), untuk mengidentifikasi pola-pola menarik untuk di representasikan kedalam knowledge based;
7. representasi pengetahuan (knowledge presentation), visualisasi dan penyajian pengetahuan mengenai teknik yang digunakan untuk memperoleh pengetahuan yangdiperoleh pengguna
Sumber :
*larose (Discovering Knowledge in Data)
*sani susanto, dedy suryadi (Pengantar data mining-Menggali Pengetahuan dari Bongkahan Data)