Metode Data Mining

Tutorial Data Mining, oleh Hilda Widyastuti-https://hildaw.wordpress.com

Berdasarkan [JK06], secara garis besar metode data mining dapat dipandang dari dua pendekatan, yaitu pendekatan deskriptif dan pendekatan prediktif.

Pendekatan deskriptif adalah pendekatan dengan cara mendeskripsikan data input. Metode yang termasuk dalam pendekatan ini adalah :

a. Metode deskripsi konsep/kelas, yaitu data dapat diasosiasikan dengan kelas atau konsep, misalnya : di toko elektonik, class item mencakup komputer dan printer, sedangkan konsep konsumen mencakup bigspender dan budgetspender. Ada 3 macam pendeskripsian, yaitu (1) karakterisasi data, dengan membuat summary karakter umum atau fitur data suatu kelas target, misalnya mempelajari karakteristik perangkat lunak yang penjualannya meningkat 10% tahun lalu,  (2) diskriminasi data, dengan membandingkan class target dengan satu atau sekelompok kelas pembanding, (3) gabungan antara karakterisasi dan diskriminasi. Output metode ini ditampilkan dalam bentuk diagram pie, diagram batang, kurva, data kubus multidimensi, tabel multidimensi, relasi general atau form rule (disebut characteristic rule).

b. Metode aturan asosiasi, yaitu membuat aturan berdasarkan kondisi yang sering terjadi. Aturan yang dibuat untuk data dalam kondisi  X, diharapkan dapat diterapkan untuk data-data lainnya dalam kondisi Y

Pendekatan kedua adalah pendekatan prediktif, yaitu pendekatan yang dapat digunakan untuk memprediksi, dengan hasil berupa kelas atau cluster. Metode yang termasuk dalam pendekatan ini adalah :

a.  Metode klasifikasi dan prediksi, yaitu metode analisis data yang digunakan untuk membentuk model yang mendeskripsikan kelas data yang penting, atau model yang memprediksikan trend data. Klasifikasi digunakan untuk memprediksikan kelas data yang bersifat categorical, sedangkan prediksi untuk memodelkan fungsi yang mempunyai nilai continuous. Contoh model klasifikasi dibangun untuk mengkategorisasikan aplikasi-aplikasi bank sebagai aplikasi yang aman atau beresiko, sedangkan model predikasi dibangun untuk memprediksikan pengeluaran konsumen berdasarkan pendapatan dan pekerjaannya.

b.  Metode Clustering, mengelompokkan data untuk membentuk kelas-kelas baru atau sering disebut cluster. Metode clustering bertujuan untuk memaksimalkan persaman dalam satu cluster dan meminimalkan perbedaan antar cluster.

Referensi :

[JK06] Han Jiawei, and M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006.

2 thoughts on “Metode Data Mining

  1. maaf, mohon dikoreksi seandainya saya salah, soalnya saya membaca buku yang judulnya ” Java Data Mining” yang ditulis oleh Mark F. Hornick, Erik Marcadé dan Sunil Venkayala, Morgan Kaufman 2006.
    Disitu dinyatakan kalau metode clustering dan association rule itu masuk dalam model deskripsi dan metode classification dan regression itu masuk model prediksi.
    Terima Kasih

    Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s