Skip to main content

Penambangan Penggunaan Web (Web Usage Mining) - Seri Text Mining dan Web Mining (8)

Penambangan penggunaan web (web usage mining) adalah proses mengekstral informasi yang berasal dari data yang dihasilkan dari kunjungan dan transaksi di halaman-halaman web. Masand (pakar web mining) mengatakan bahwa sedikitnya ada tiga jenis data yang dihasilkan dari kunjungan di web:
  1. Data yang secara otomatis dihasilkan dan disimpan dalam bentuk log akses ke server, log perujuk (link yang merujuk), log tentang agent (browser),  dan cookie di komputer klien
  2. Profile user
  3. Metadata, seperti atribut halaman, atribut konten, dan data penggunaan web. [Baca juga tentang Metadata di dalam data warehouse dan apa isinya]
Analisa terhadap informasi yang dikumpulkan oleh web server bisa membantu kita untuk memahami perilaku pengguna. Analisa terhadap data ini seringkali disebut dengan analisa clickstream. Dengan menggunakan data dan teknik-teknik text mining, perusahaan bisa melihat pola-pola menarik yangberasal dari clickstream. Contohnya, bisa diketahui bahwa 60 persen pengunjung yang mencari “hotel di Maui” sebelumnya ternyata mencari “tiket pesawat ke Maui”. Informasi sepert itu bisa sangat bermanfaat untuk digunakan menentukan dimana iklan online ditempatkan. Analisa clickstream juga bisa untuk mengetahui kapan pengunjung mengakses suatu situs. Contohnya, jika suatu perusahaan mengetahui bahwa 70 persen dari software yang didownload dari situsnya terjadi antara jam 7 dan 11 malam, informasi tersebut bisa digunakan untuk merencanakan support pelanggan dan bandwidth jaringan yang lebih baik selama jam-jam tersebut.


Gambar di atas menunjukkan proses mengekstrak knowledge dari data clickstream dan bagaimana knowledge yang dihasilkan tersebut digunakan untuk memperbaiki dan meningkatkan proses, meningkatkan situs, dan yang paling penting, meningkatkan nilau pelanggan. Nasraoui (peneliti web mining) membuat daftar  terhadap penerapan web mining seperti berikut:
  1. Menentukan nilai dari klien seumur hidup
  2. Mendesain strategi cross-marketing  terhadap produk
  3. Mengevaluasi campaign promosi
  4. Membuat target iklan online dank upon pada berbagai kelompok pengguna berdasarkan pola-pola akses pengguna
  5. Memprediksi perilaku pengguna berdasarkan berbagai aturan dan pola yang sudah dipelajari sebelumnya  dan berdasarkan profil pengguna
  6. Menyajikan informasi dinamis kepada oengguna berdasarkan pada minat dan profil mereka


Amazon.com memberikan contoh yang baik tentang bagaimana riwayat penggunaan web bisa ditingkatkan secara dinamis. Pengguna yang terdaftar yang mengunjungi kembali amazon.com disapa dengan menggunakan nama mereka. Ini adalah hal yang sederhana yang menggunakan pengenalan terhadap pengunjung/pengguna dengan cara membaca cookie (misalnya, suatu file teks kecil yang ditulis oleh situs di komputer pengguna). Amazon.com juga menyajikan pengguna dengan suatu pilihan produk dalam toko online mereka yang sudah dipersonalisasikan, berdasarkan pembelian sebelumnya dan analisa asosiasi dari pengguna yang serupa. Hal seperti ini juga membuat penawaran “Gold Box”  (diskon dalam waktu yang sangat singkat biasanya hanya 1 hari saja) khusus yang sangat baik untuk waktu yang singkat. Semua rekomendasi ini memerlukan analisa detil tentang pengunjung dan juga kelompok sesame pengguna yang dikembangkan melalui teknik-teknik clustering, sequence pattern discovery, association, dan teknik-teknik data dan text mining lainnya.

Table berikut adalah daftar dari beberapa produk wb mining yang popular:
Software Web Usage Mining
Nama Produk
Deskripsi
URL
Angoss Knowledge WebMiner
Menggabungkan Angoss Knowledge STUDIO dan analisa clickstream
Angoss.com
ClickTracks
Pola-pola pengunjung bisa ditampilkan di web
Clicktracks.com
LiveStats dari DeepMetrix
Analisa log real-time, live demo on site
Deepmetrix.com
Megaputer WebAnalyst
Memiliki kemampuan data mining dan text mining
Megaputer.com/products/wm.php3
MicroStrategy Web Traffic Analysis Module
Berfokus pada traffic, analisa konten, dan report analisa pengunjung web
Microstrategy/Solutions/Applications/WTAM
SAS Web Analytics
Menganalisa traffic situ web
Sas.com/solutions/webanalytics/
SPSS Web Mining for Clementine
Mengekstrak berbagai peristiwa/transaksi web
Spss.com/web_mining_for_clementine
WebTrends
Data mining untuk informasi traffic web
Webtrends.com
XML Miner
System dan library class untuk menambang data dan text yang disajikan dalam bentuk XML, dengan menggunakan logika samar (fuzzy logic) dan rules dari system pakar (expert system)
Scientio.com

Comments

Popular posts from this blog

Pengertian Binding dalam Bahasa Pemrograman dan Kapan Terjadinya

Binding dimaksudkan sebagai pengikatan (association) antara suatu entity dengan atributnya, misalnya binding/pengikatan antara suatu variable dengan tipe datanya atau dengan nilainya, atau dapat juga antara suatu operasi dengan simbol, misalnya simbol + dikenali sebagai operasi penjumlahan atau simbol ^ dikenali sebagai operasi pangkat, dll.  Peristiwa binding dan kapan terjadinya binding (biasanya disebut dengan binding time ) berperan penting dalam membicarakan semantics suatu bahasa pemrograman. Beberapa kemungkinan binding time adalah:

Contoh proses normalisasi relasi dari UNF – 1NF – 2NF – dan 3NF

Dalam posting tulisan tentang: “Tujuan dan Manfaat Normalisasi dalam Perancangan Database” , kita sudah mempelajari tentang: “Apa itu normalisasi” dan “Mengapa kita perlu melakukan normalisasi”. Kedua pertanyaan itu sudah terjawab dalam tulisan tersebut.  Kemudian dalam posting tulisan tentang: “Konsep Ketergantungan Fungsional, Normalisasi, dan Identifikasi Primary Key dalam Perancangan Sistem Database” , kita sudah mempelajari suatu konsep penting yang digunakan untuk melakukan normalisasi, yaitu konsep ketergantungan fungsional yang terdiri dari ketergantungan penuh, ketergantungan parsial atau sebagian, dan ketergantungan transitif. Proses normalisasi pertama-tama dilakukan dengan mengidentifikasi adanya ketergantungan-ketergantungan tersebut dalam relasi-relasi dan kemudian menghilangkannya. Cara melakukan normalisasi, mengidentifikasi berbagai macam ketergantungan, dan menghilangkan ketergantungan pada relasi-relasi bisa dipelajari ulang dalam postingan tulisan d...

Latihan Soal Jawab Matematika Diskrit

Berikut di bawah ini adalah latihan soal jawab untuk matematika diskrit dengan topik-topik: Pernyataan Logika Circuits dan Ekspresi Boolean Argumen (valid/tidak valid) Teori Himpunan Permutasi Fungsi --o0o-- Pernyataan Logika 1. Buatlah tabel kebenaran untuk menentukan yang mana tautology dan yang mana contradiction dalam pernyataan logika (a) dan (b) di bawah ini: a. (p ∧ q) ∨ (∼p ∨ (p ∧ ∼q)) b.  (p ∧ ∼q) ∧ (∼p ∨ q)