Apakah Text Mining itu?

Tutorial Data Mining oleh Hilda Widyastuti – https://hildaw.wordpress.com

Text mining adalah data mining dengan input data berupa text. Text mining  muncul karena sekitar 90% data di dunia dalam bentuk format tidak terstruktur, adanya kebutuhan bisnis, yang asalnya document retrieval menjadi knowledge discovery.

Definisi text mining berdasarkan [WLSZ05] adalah proses untuk menemukan pengetahuan baru, yang belum pernah diketahui, secara otomatis oleh komputer dari sumber-sumber tertulis yang berbeda.

Istilah informasi yang belum pernah diketahui sebelumnya ada 2 macam, yaitu :
a. Strict definition, yaitu informasi yang belum pernah diketahui sebelumnya, bahkan oleh penulisnya sekalipun. Contohnya adalah menemukan metode baru untuk pertumbuhan rambut, yang merupakan efek samping dari prosedur lain yang ada

b. Lenient definition, yaitu menemukan informasi yang sudah ada di teks. Contohnya menemukan nama suatu produk dari halaman web.

Referensi :

[WLSZ05] Fan Weiguo, Wallace Linda, Rich Stephanie, and Zhang Zhongju, Tapping into the Power of Text Mining, 2005, accepted for publication at the Communications of ACM, 2005.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s