Teknologi pada Text Mining

Tutorial Data Mining oleh Hilda Widyastuti – https://hildaw.wordpress.com

Teknologi-teknologi yang dapat digunakan untuk analisis text pada text mining berdasarkan [WLSZ05] :
a.Ekstraksi informasi, yaitu mengidentifikasi frase-frase kunci dan keterkaitannya dalam 1 dokumen atau antar dokumen. Hampir semua software text mining menggunakan ekstraksi informasi karena menjadi basis teknologi-teknologi lainnya.

b.Penelusuran topik, bekerja dengan menyimpan profil pengguna, dan berdasarkan dokumen-dokumen yang pernah dilihat oleh pengguna. Teknologi ini akan memprediksi dokumen lain yang dapat menarik perhatian pengguna.

c.Summary, bermanfaat memberi informasi kepada pengguna isi paragraf, tanpa harus membaca seluruh paragraf. Caranya dengan menentukan bobot kalimat dengan statistik.

d.Kategorisasi, menempatkan dokumen ke topik-topik yang sudah ditentukan, dan mempunyai metode untuk merangking dokumen

e.Clustering, melakukan pengelompokan dokumen-dokumen yang mirip

f.Concept linkage, menemukan keterkaitan antara satu topik dengan topik yang lain. Misalnya : diketahui ada keterkaitan antara topik x dan topik y, dan ada keterkaitan antara topik ydan topik z. Dari 2 buah keterkaitan itu, ada potensi keterkaitan antara topik x dan z

g.Visualisasi informasi, menampilkan informasi secara visual

h.Bertanya dan menjawab, mirip FAQ (frequently ask question)

Referensi :
[WLSZ05] Fan Weiguo, Wallace Linda, Rich Stephanie, and Zhang Zhongju, Tapping into the Power of Text Mining, 2005, accepted for publication at the Communications of ACM, 2005.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s