Skip to main content

Posts

Pendekatan dalam Project Pengembangan Data Warehouse - Seri Data Warehouse (5)

Project pengembangan data warehouse adalah suatu usaha yang besar bagi suatu perusahaan manapun dan lebih rumit dibandingkan dengan project implementasi dan memilih mainframe karena project ini melibatkan dan memberi pengaruh pada banyak departemen dan banyak interface input dan output dan mungkin saja merupakan bagian dari strategi bisnis CRM ( customer relation management ).  [ Baca juga & bandingkan: Pendekatan dalam Project Pengembangan Business Intelligence ] Apa saja manfaat data warehouse? Manfaat langsung meliputi: Memungkinkan end-users untuk melakukan berbagaia analisa ekstensif dalam berbagai cara Adanya data korporat/perusahaan yang menampilkan data yang sudah terkonsolidai dengan baik (satu versi data yang sudah valid ) Informasi yang lebih baik dan lebih tepat waktu.   Data warehouse memungkinkan pemrosesan informasi untuk dipindahkan dari sistem operasional yang mahal ke server-server yang murah, sehingga request informasi dari ...

Proses ETL (Extract-Transform-Load) dalam Data Warehouse - Seri Data Warehouse (4)

Apa yang dimaksud dengan integrasi data ( data integration )? Integrasi data (atau data integration) adalah istilah umum dan luas ( umbrella term ) yang mencakup tiga proses yang menggabungkan data dari berbagai sumber data ke dalam data warehouse, tiga proses teresebut meliputi: 1) mengakses data, 2) menggabungkan berbagai macam view data yang berbeda-beda dan 3) menangkap perubahan data.

Beberapa Alternatif Arsitektur Data Warehouse - Seri Data Warehouse (3)

Ada beberapa jenis arsitektur dasar untuk data warehouse . Yang paling umum adalah 2-tier dan 3-tier, tetapi kadang-kadang ada juga yang sederhana yaitu 1-tier. Hoffer et al. (2007) membedakan diantara arsitektur-arsitektir tersebut dengan membagi data wahouse menjadi tiga bagian: Data warehouse itu sendiri, yang berisi data dan software terkait Software untuk data akuisisi, yang mengekstrak data dari sistem-sistem legacy dan berbagai sumber eksternal, mengonsolidasikan dan men-summarize-kan, dan kemudian me-load data ke data warehouse Software klien/front-end, yang memungkinkan pengguna untuk mengakses dan menganalisa data dari data warehouse (engine DSS/BI/BA)

Proses dalam Data Warehouse (Data Warehousing) - Seri Data Warehouse (2)

Bagaimanakah proses dalam data warehouse (atau disebut juga data warehousing)? Proses dalam data warehouse atau data warehousing (catatan: istilah data warehouse mengacu ke tempat repository  data sementara istilah data warehousing mengacu ke proses perjalanan data dari berbagai sumber data hingga masuk ke data warehouse ) terdiri dari tahap-tahap berikut ini: Data di- import dari berbagai sumber data internal maupun eksternal Data di- cleansed atau dibersihkan dan diorganisir secara konsisten sesuai dengan kebutuhan perusahaan a) Data di- load atau di- export atau dimasukkan ke data warehouse enterprise, atau b). Data di- load/export /di masukkan ke data marts [ tentang definisi data marts bisa dibaca pada artikel sebelumnya tentang   Data Warehouse dan Beberapa Karakteristiknya di link ini ] a). Bila diinginkan, data marts dibuat sebagai subset atau bagian dari EDW ( enterprise data warehouse ), atau b) Data marts disatukan menjadi EDW Analisa di...

Data Warehouse dan Beberapa Karakteristiknya - Seri Data Warehouse (1)

Apa yang dimaksud dengan data warehouse ? Secara literal, warehouse adalah gudang (yang berarti tempat menyimpan barang bekas/lama). Jadi secara literal data warehouse adalah gudang data (tempat menyimpan data lama). Pengertian  Data warehouse (atau bisa disebut juga gudang data), dalam definisi yang paling sederhana adalah tempat kumpulan data (historis/lama) yang dibuat untuk mendukung pengambilan keputusan. Dengan definisi ini berarti kita berfokus pada hal-hal yang mendasar, dan mengabaikan karakteristik-karakteristik yang mungkin berbeda-beda dari satu data warehouse dengan data warehouse yang lainnya tetapi tidak terlalu memberikan kontribusi yang penting terhadap konsep dasar data warehouse . Ada definisi lain yang lebih spesifik mengacu ke karakteristik data warehouse , yaitu: " data warehouse adalah sekumpulan data yang memiliki karakter-karakter berorientasi-subjek, terintegrasi, time-variant ( time series ), nonvolatile (bersifat tetap selamanya), ...

Contoh Soal Klasifikasi Dalam Data Mining: Decision Tree - Rules Based - Naive Bayesian

Di bawah ini adalah tabel yang berisi training data dari database karyawan.  Data ini sudah di-geralisasi-kan. Misalnya, “31…35” untuk usia berarti kisaran usia antara 31 hingga 35. Khusus untuk kolom  "jumlah", itu menunjukkan  jumlah tuples dari masing-masing data pada department, status, usia, dan gaji pada baris yang dimaksud

Contoh Soal dan Jawaban Ujian Data Mining

Essay: 1. Apa perbedaan supervised learning dan unsupervised learning?     2. Berikut adalah decision tree Suatu object X memiliki nilai-nilai atribut seperti berikut, X=(A=100; B=0; C=20). Klasifikasikan kelas apakah object X?