Di dalam ilmu statistika, ada istilah yang disebut dengan data mining atau penggalian data. Pengertian data mining adalah proses analisa yang jauh lebih mendalam pada data – data yang sudah diperoleh dan dikumpulkan sebelumnya. Data Mining sendiri adalah salah satu proses dari 7 langkah pencarian pola. 7 langkah tersebut antara lain adalah:
- Pembersihan Data
- Integrasi Data
- Pemilihan Data
- Transformasi Data
- Penggalian Data (Data Mining)
- Evaluasi Pola
- Penyajian Pola
Untuk dapat memahami pengertian data mining secara lebih baik, kita perlu mempelajari beberapa tahapan yang harus dilalui dalam pengerjaan data mining, antara lain:
- Identifikasi Masalah Bisnis
Sebelum mengolah data, kita harus terlebih dahulu memahami permasalahan – permasalahan bisnis yang kita hadapi. Dengan menentukan masalah bisnis yang akan kita tindak lanjuti, proses penggalian data akan lebih terarah dan hasilnya juga akan lebih presisi dan efektif.
- Penggalian Data untuk Informasi yang Bisa Dikerjakan
Setelah identifikasi masalah selesai, barulah kita mulai mengkaji setiap data – data yang kita miliki secara lebih terperinci dan mendalam. Setelah itu, tentunya kita akan mendapatkan sebuah informasi baru yang membentuk suatu pola. Dari sini, kita dapat mengambil suatu keputusan atau kesimpulan.
Setelah diambil keputusan atau kesimpulan, tugas kita selanjutnya adalah menindaklanjutinya dengan langkah-langkah yang kongkrit. Dalam bahasa inggris, istilahnya adalah “take action”.
Setelah melakukan tindak lanjut berupa langkah – langkah kongkrit, kita perlu memonitor pekerjaan yang kita lakukan tersebut. Dalam monitoring tersebut, kita juga melakukan evaluasi terhadap keputusan dan kesimpulan yang kita ambil pada data mining yang kita lakukan tersebut.
Dalam ilmu penggalian data, ada berbagai macam jenis fungsionalitas yang bisa digunakan. Beberapa contohnya yang paling umum digunakan antara lain adalah:
- Deskripsi, yaitu proses menggeneralisasikan dan merangkum data – data sehingga mucul beberapa karakteristik
- Klasifikasi, yaitu proses pembangunan suatu model yang dapat memilah dan mengelompokkan objek-objek yang ada
- Prediksi, yaitu proses membuat perkiraan atas satu data atau nilai yang hilang dengan menganalisa dari klasifikasi
- Analisis Outlier, yaitu proses pengolahan data yang tidak bisa digeneralisasikan atau diklasifikasikan secara umum
Sekiranya cukup sekian penjelasan dari kami mengenai pengertian data mining serta cara pengaplikasian ilmunya. Jangan lupa untuk mempelajari berbagai ilmu bermanfaat lainnya dari kami.