Skip to main content

Konsep dan Aplikasi Data Mining - Seri Data Mining for Business Intelligence (1)

Secara umum, pengertian data mining untuk business intelligence adalah cara-cara untuk mengembangkan business intelligence dari data yang dikumpulkan, diorganisir, dan disimpan oleh suatu organisasi. Teknik-teknik dalam data mining sangatlah luas sekali dan digunakan oleh berbagai organisasi untuk mendapatkan pemahaman yang lebih baik mengenai pelanggan dan cara kerja mereka dan untuk menyelesaikan berbagai masalah organisasi yang sangat kompleks. Dalam seri ini kita akan mempelajari data mining sebagai teknologi pendorong bagi business intelligence, mempelajari proses-proses standard dalam melaksanakan proyek-proyek data mining, memahami dan membangun keahlian dalam menggunakan teknik-teknik data mining yang populer, mengembangkan pengetahuan mengenai berbagai tool software yang ada, dan membedah berbagai macam mitos dan jebakan dalam data mining.

Konsep dan aplikasi data mining

Dalam suatu interview dengan majalah ‘Computerworld’ pada Januari 1999, Dr. Arno Penzias (pemenang nobel dan mantan kepala peneliti di Bell Labs) mengatakan bahwa sebentar lagi data mining dari berbagai database perusahaan akan menjadi aplikasi yang menjadi andalan. Dalam menjawab pertanyaan klasik dari ‘Computerworld’ mengenai “Apakah yang akan menjadi aplikasi killer bagi korporasi?” Dr. Penzias menjawab: “Data mining”.  Kemudian dia menambahkan, “Data mining akan menjadi sesuatu yang sangat penting sehingga perusahaan-perusahaan tidak akan membuang (data) apapun mengenai para pelanggan mereka karena hal itu merupakan sesuatu yang sangat berharga. Bila anda tidak melakukan hal ini (data mining), anda akan terdepak keluar dari bisnis”. Demikian pulan, dalam suatu artikel di ‘Harvard Business review’ Thomas Davenport (2006) berpendapat bahwa  senjata strategis terbaru bagi perusahaan-perusahaan adalah  pembuatan keputusan berdasarkan analitik, dengan memberikan contoh-contohnya seperti Amazon.com, Capital One, Marriot International, dan lain-lain yang telah menggunakan analitik untuk memahami mengenai para pelanggan mereka dengan lebih baik dan mengoptimasi supply chain mereka yang untuk memaksimalkan RoI (return on investment) mereka sembari memberikan customer service yang terbaik. Tingkat kesuksesan seperti ini akan bergantung pada perusahaan yang memahami pelanggannya, vendornya, proses bisnisnya, dan supply chain-nya dengan baik.

Komponen utama dari pemahaman ini bermula dengan cara menganalisa jumlah data yang sangat banyak yang dikumpulkan perusahaan. Biaya yang digunakan untuk menyimpan dan memproses data dalam beberapa waktu terakhir  telah menurun secara dramatis, dan dampaknya, jumlah data yang disimpan dalam bentuk elektronik menjadi tumbuh dalam jumlah yang eksplosif.  Dengan pembuatan database-database yang besar, kemungkinan menganalisa data yang disimpan menjadi muncul/ada. Istilah data mining awalnya digunakan untuk menjelaskan proses dimana berbagai pola di dalam data yang tak diketahui sebelumnya  menjadi terungkap. Definisi tersebut kemudian diperluas oleh beberapa vendor software untuk memasukkan sebagian besar bentuk analisa data untuk meningkatkan penjualan dengan popularitas label data mining. Pada seri ini, kita akan menggunakan definisi asli mengenai data mining.

Meskipun istilah data mining relatif baru, tetapi ide dibelakangnya sama sekali bukan sesuatu yang baru. Banyak sekali teknik dalam data minig yang berasal dari analisa statistik tradisional dan kecerdasan buatan yang dilakukan di awal 1980an. Mengapa kemudian secara tiba-tiba mendapat perhatian dari dunia bisnis? Berikut adalah beberapa alasan yang paling banyak disebut:
  • Kompetisi yang semakin intens di skala global yang didorong oleh kebutuhan dan keinginan pelanggan yang selalu berubah di pasar yang makin lama makin jenuh.
  • Sudah menjadi pengetahuan umum bahwa ada nilai tersembunyi yang belum dimanfaatkan di dalam sumber-sumber data yang besar. 
  • Konsolidasi dan integrasi baris-baris dalam database, yang memungkinkan suatu tampilan tunggal mengenai pelanggan, vendor, transaksi, dll.
  • Konsolidasi database dan penyimpanan data yang lain ke dalam satu lokasi tunggal dalam bentuk data warehouse.
  • Kemajuan yang pesat dan eksponensial dalam pemrosesan data dan teknologi database.
  • Penurunan harga yang signifikan dalam hardware dan software untuk penyimpanan dan pemrosesan data.
  • Gerakan menuju ‘de-massification’ (konversi berbagai informasi kedalam bentuk yang non-fisik) dalam praktik-praktik bisnis.
Data yang dihasilkan oleh Internet meningkat dengan cepat baik dari sisi volume dan kompleksitas. Jumlah data yang sangat besar terus menerus dihasilkan dan diakumulasikan diseluruh dunia. Berbagai disiplin ilmu seperti astronomi dan fisika nuklir selalu menghasilkan kuantitas data yang besar secara regular. Pera peneliti di bidang farmasi dan kedokteran secara konstan menghasilkan dan menyimpan data yang bisa digunakan dalam aplikasi data mining untuk mengetahui cara-cara yang lebih baik untuk mendiagnosa secara akurat dan mengobati penyakit dan untuk menemukan obat-obat baru yang lebih baik.

Pada bidang komersial, barangkali penggunaan data mining yang paling umum ada dalam bidang finance, retail, dan healthcare. Data mining digunakan untuk mendeteksi dan mengurangi berbagai aktivitas penipuan, terutama dalam klaim asuransi dan penggunaan kartu kredit; untuk mengetahui pola-pola pembelian oleh pelanggan; untuk mengakuisisi kembali para pelanggan yang menguntungkan; untuk mengetahui berbagai aturan perdangan berdasarkan data historis; dan untuk membantu untuk meningkatkan profitabilitas dengan menggunakan market-basket analysis. Data mining sudah digunakan secara luas untuk menarget klien-klien secara lebih baik, dan dengan perkembangan e-commerce yang luas, hal ini akan menjadi suatu yang lebih wajib seiring berjalannya waktu.

Comments

Popular posts from this blog

Pengertian Binding dalam Bahasa Pemrograman dan Kapan Terjadinya

Binding dimaksudkan sebagai pengikatan (association) antara suatu entity dengan atributnya, misalnya binding/pengikatan antara suatu variable dengan tipe datanya atau dengan nilainya, atau dapat juga antara suatu operasi dengan simbol, misalnya simbol + dikenali sebagai operasi penjumlahan atau simbol ^ dikenali sebagai operasi pangkat, dll.  Peristiwa binding dan kapan terjadinya binding (biasanya disebut dengan binding time ) berperan penting dalam membicarakan semantics suatu bahasa pemrograman. Beberapa kemungkinan binding time adalah:

Contoh proses normalisasi relasi dari UNF – 1NF – 2NF – dan 3NF

Dalam posting tulisan tentang: “Tujuan dan Manfaat Normalisasi dalam Perancangan Database” , kita sudah mempelajari tentang: “Apa itu normalisasi” dan “Mengapa kita perlu melakukan normalisasi”. Kedua pertanyaan itu sudah terjawab dalam tulisan tersebut.  Kemudian dalam posting tulisan tentang: “Konsep Ketergantungan Fungsional, Normalisasi, dan Identifikasi Primary Key dalam Perancangan Sistem Database” , kita sudah mempelajari suatu konsep penting yang digunakan untuk melakukan normalisasi, yaitu konsep ketergantungan fungsional yang terdiri dari ketergantungan penuh, ketergantungan parsial atau sebagian, dan ketergantungan transitif. Proses normalisasi pertama-tama dilakukan dengan mengidentifikasi adanya ketergantungan-ketergantungan tersebut dalam relasi-relasi dan kemudian menghilangkannya. Cara melakukan normalisasi, mengidentifikasi berbagai macam ketergantungan, dan menghilangkan ketergantungan pada relasi-relasi bisa dipelajari ulang dalam postingan tulisan d...

Latihan Soal Jawab Matematika Diskrit

Berikut di bawah ini adalah latihan soal jawab untuk matematika diskrit dengan topik-topik: Pernyataan Logika Circuits dan Ekspresi Boolean Argumen (valid/tidak valid) Teori Himpunan Permutasi Fungsi --o0o-- Pernyataan Logika 1. Buatlah tabel kebenaran untuk menentukan yang mana tautology dan yang mana contradiction dalam pernyataan logika (a) dan (b) di bawah ini: a. (p ∧ q) ∨ (∼p ∨ (p ∧ ∼q)) b.  (p ∧ ∼q) ∧ (∼p ∨ q)