Beberapa Mitos dan Blunder Dalam Data Mining - Seri Data Mining for Business Intelligence (8)

Beberapa mitos dan blunder dalam data mining

Data Mining (DM) adalah tool analitis yang sangat hebat yang memungkinkan para eksekutif bisnis untuk bergeser maju dari gambaran karakter dasar masa lalu ke prediksi masa mendatang. DM membantu para marketer untuk menemukan pola yang membuka misteri perilaku pelanggan.hasil-hasil dari DM bisa digunakan untuk meningkatkan revenue, mengurangi biaya, mengidentifikasi fraud, dan mengetahui peluang-peluang bisnis, yang menawarkan keunggulan kompetitif yang benar-benar baru. Sebagai satu disiplin ilmu yang berkembang dan sedang matang, DM seringkali dikaitkan dengan sejumlah mitos, termasuk mitos-mitos berikut:

Berbagai Tool Software Data Mining - Seri Data Mining for Business Intelligence (7)

Berbagai Tool Software Data Mining

Banyak vendor software menyediakan berbagai tool data mining. Contoh-contoh vendor tersebut adalah SPSS (PASW Modeler, sebelumnya dikenal sebagai Clementine), SAS (Enterprise Miner), StstSoft (Statistica Data Miner), Salford (CART, MARS, TreeNet, RandomForest), Angoss (KnowledgesSTUDIO, KnowledgeSeeker), dan Megaputer (PolyAnalyst). Seperti bisa dilihat diatas, kebanyakan dari tool-tool popular tersebut dikembangkan oleh perusahaan-perusahaan software statistic terbesar (SPSS, SAS, dan StatSoft). Kebanyakan dari vendor-vendor tool ‘business intelligence (BI)’ (seperti IBM Cognos, Oracle Hyperion, SAP Business Objects, Microstrategy, Teradata, dan Microsoft) juga memiliki tingkat kemampuan data mining yang terintegrasi dengan tawaran-tawaran software mereka.tool-tool BI ini utamanya masih berfokus pada pemodelan multidimensional dan visualisasi data dan tidak ditujukan untuk menjadi pesaing langsung dari vendor-vendor tool data minig tersebut.

Metode-metode dalam Data Mining - Seri Data Mining for Business Intelligence (6)

Metode-metode dalam DM

Ada banyak metode untuk melakukan kajian DM, antara lain ‘classification’ (klasifikasi), ‘regression’ (regresi), ‘clustering’, dan ‘association’ (asosiasi). Kebanyakan tool software DM menerapkan lebih dari satu teknik (atau algoritma) untuk setiap metode-metode tersebut. Bagian seri ini akan menyajikan metode-metode DM yang paling popular dan menjelaskan teknik-teknik penyajiannya.

Proses dalam Data Mining - Seri Data Mining for Business Intelligence (5)

Proses dalam Data Mining

Untuk melaksanakan project-project dalam Data Mining (DM) secara sistematis, suatu proses yang umum berlaku biasanya diterapkan. Berdasarkan ‘best practice’, para praktisi dan peneliti DM mengusulkan beberapa proses (workflow atau pendekatan step-by-step yang sederhana) untuk memperbesar peluang keberhasilan dalam melaksanakan project-project DM. Usaha-usaha itu akhirnya menghasilkan beberapa proses yang dijadikan sebagai standard, beberapa diantaranya (yang paling popular) dibahas dalam bagian ini. [Baca juga: Metode-metode dalam Data Mining]

Penerapan-penerapan Data Mining - Seri Data Mining for Business Intelligence (4)

Penerapan-penerapan Data Mining

Data mining (DM) sudah menjadi suatu piranti yang sangat populer  dalam  menangani banyak isu bisnis yang kompleks. DM sudah terbukti sangat sukses dan bermanfaat di berbagai area, diantaranya adalah seperti yang ditunjukkan dengan berbagai contoh yang disajikan berikut. Tujuan dari berbagai penerapan DM dalam bisnis adalah untuk menyelesaikan suatu masalah yang sangat memberi ‘pressure’ atau untuk mencari peluang bisnis yang bisa dimunculkan untuk membuat keunggulan kompetitif yang berkelanjutan.

Cara Kerja Data Mining - Seri Data Mining for Business Intelligence (3)

Bagaimana cara kerja data mining

Dengan menggunakan data yang ada dan relevan, data mining membuat beberapa model untuk mengidentifikasi pola-pola diantara atribut-atribut yang ada di dalam dataset. Model adalah penyajian matematis (persamaan linear sederhana dan/atau persamaan kompleks yang sangat tidak linear) yang mengidentifikasi pola-pola diantara berbagai atribut object (misalnya, pelanggan) yang ada di dalam dataset. Beberapa pola tersebut adalah bersifat deskriptif (menjelaskan saling-keterkaitan atau persamaan dan kesamaan diantara berbagai atribut tersebut), sementara yang lain adalah bersifat prediktif (meprediksi ‘value/hasil’ yang akan terjadi pada atribut-atribut tertentu). Secara umum, data mining mengidentifikasi empat jenis pola utama: