Skip to main content

Posts

Showing posts from November, 2014

Pendekatan dalam Project Pengembangan Data Warehouse - Seri Data Warehouse (5)

Project pengembangan data warehouse adalah suatu usaha yang besar bagi suatu perusahaan manapun dan lebih rumit dibandingkan dengan project implementasi dan memilih mainframe karena project ini melibatkan dan memberi pengaruh pada banyak departemen dan banyak interface input dan output dan mungkin saja merupakan bagian dari strategi bisnis CRM ( customer relation management ).  [ Baca juga & bandingkan: Pendekatan dalam Project Pengembangan Business Intelligence ] Apa saja manfaat data warehouse? Manfaat langsung meliputi: Memungkinkan end-users untuk melakukan berbagaia analisa ekstensif dalam berbagai cara Adanya data korporat/perusahaan yang menampilkan data yang sudah terkonsolidai dengan baik (satu versi data yang sudah valid ) Informasi yang lebih baik dan lebih tepat waktu.   Data warehouse memungkinkan pemrosesan informasi untuk dipindahkan dari sistem operasional yang mahal ke server-server yang murah, sehingga request informasi dari ...

Proses ETL (Extract-Transform-Load) dalam Data Warehouse - Seri Data Warehouse (4)

Apa yang dimaksud dengan integrasi data ( data integration )? Integrasi data (atau data integration) adalah istilah umum dan luas ( umbrella term ) yang mencakup tiga proses yang menggabungkan data dari berbagai sumber data ke dalam data warehouse, tiga proses teresebut meliputi: 1) mengakses data, 2) menggabungkan berbagai macam view data yang berbeda-beda dan 3) menangkap perubahan data.

Beberapa Alternatif Arsitektur Data Warehouse - Seri Data Warehouse (3)

Ada beberapa jenis arsitektur dasar untuk data warehouse . Yang paling umum adalah 2-tier dan 3-tier, tetapi kadang-kadang ada juga yang sederhana yaitu 1-tier. Hoffer et al. (2007) membedakan diantara arsitektur-arsitektir tersebut dengan membagi data wahouse menjadi tiga bagian: Data warehouse itu sendiri, yang berisi data dan software terkait Software untuk data akuisisi, yang mengekstrak data dari sistem-sistem legacy dan berbagai sumber eksternal, mengonsolidasikan dan men-summarize-kan, dan kemudian me-load data ke data warehouse Software klien/front-end, yang memungkinkan pengguna untuk mengakses dan menganalisa data dari data warehouse (engine DSS/BI/BA)

Proses dalam Data Warehouse (Data Warehousing) - Seri Data Warehouse (2)

Bagaimanakah proses dalam data warehouse (atau disebut juga data warehousing)? Proses dalam data warehouse atau data warehousing (catatan: istilah data warehouse mengacu ke tempat repository  data sementara istilah data warehousing mengacu ke proses perjalanan data dari berbagai sumber data hingga masuk ke data warehouse ) terdiri dari tahap-tahap berikut ini: Data di- import dari berbagai sumber data internal maupun eksternal Data di- cleansed atau dibersihkan dan diorganisir secara konsisten sesuai dengan kebutuhan perusahaan a) Data di- load atau di- export atau dimasukkan ke data warehouse enterprise, atau b). Data di- load/export /di masukkan ke data marts [ tentang definisi data marts bisa dibaca pada artikel sebelumnya tentang   Data Warehouse dan Beberapa Karakteristiknya di link ini ] a). Bila diinginkan, data marts dibuat sebagai subset atau bagian dari EDW ( enterprise data warehouse ), atau b) Data marts disatukan menjadi EDW Analisa di...

Data Warehouse dan Beberapa Karakteristiknya - Seri Data Warehouse (1)

Apa yang dimaksud dengan data warehouse ? Secara literal, warehouse adalah gudang (yang berarti tempat menyimpan barang bekas/lama). Jadi secara literal data warehouse adalah gudang data (tempat menyimpan data lama). Pengertian  Data warehouse (atau bisa disebut juga gudang data), dalam definisi yang paling sederhana adalah tempat kumpulan data (historis/lama) yang dibuat untuk mendukung pengambilan keputusan. Dengan definisi ini berarti kita berfokus pada hal-hal yang mendasar, dan mengabaikan karakteristik-karakteristik yang mungkin berbeda-beda dari satu data warehouse dengan data warehouse yang lainnya tetapi tidak terlalu memberikan kontribusi yang penting terhadap konsep dasar data warehouse . Ada definisi lain yang lebih spesifik mengacu ke karakteristik data warehouse , yaitu: " data warehouse adalah sekumpulan data yang memiliki karakter-karakter berorientasi-subjek, terintegrasi, time-variant ( time series ), nonvolatile (bersifat tetap selamanya), ...

Contoh Soal Klasifikasi Dalam Data Mining: Decision Tree - Rules Based - Naive Bayesian

Di bawah ini adalah tabel yang berisi training data dari database karyawan.  Data ini sudah di-geralisasi-kan. Misalnya, “31…35” untuk usia berarti kisaran usia antara 31 hingga 35. Khusus untuk kolom  "jumlah", itu menunjukkan  jumlah tuples dari masing-masing data pada department, status, usia, dan gaji pada baris yang dimaksud

Contoh Soal dan Jawaban Ujian Data Mining

Essay: 1. Apa perbedaan supervised learning dan unsupervised learning?     2. Berikut adalah decision tree Suatu object X memiliki nilai-nilai atribut seperti berikut, X=(A=100; B=0; C=20). Klasifikasikan kelas apakah object X? 

Manfaat & Sejarah Batch Processing

Batch processing adalah eksekusi dari serangkaian program ("pekerjaan") dari komputer tanpa intervensi manual. Jobs (pekerjaan) ditetapkan sedemikian rupa sehingga mereka dapat dijalankan sampai selesai tanpa interaksi manusia. Semua parameter input yang telah ditetapkan melalui suatu script , baris-baris perintah komputer, file-file kontrol, atau bahasa pemrograman untuk melakukan kontrol pekerjaan. Hal ini berbeda dengan " online " atau program interaktif yang mengajukan kepada pengguna untuk melakukan input ke sistem. Sebuah program membutuhkan satu set file data sebagai input , memproses data, dan menghasilkan satu set file data sebagai output . Lingkungan operasi semacam ini disebut sebagai " batch processing " karena data input dikumpulkan ke dalam batch atau sekumpulan record data dan setiap batch diproses sebagai satu unit. Output -nya adalah batch lain yang dapat digunakan kembali untuk komputasi Batch processing memiliki manfaat:...

Apakah Komputasi Awan Atau Cloud Computing itu?

Dalam beberapa tahun terakhir, komputasi awan telah menjadi topik hangat  untuk para  vendor TI dan eksekutif TI. Apa itu komputasi awan (atau cloud computing)?   Komputasi awan artinya adalah bahwa kita bisa mendapatkan  berbagai sumber daya dan kapabilitas (misalnya, hardware, software, atau services) dari vendor TI melalui jaringan,pada umumnya jaringan Internet. "Awan" adalah sebuah metafora untuk internet, sehingga frasa "komputasi awan"  berarti bahwa sumber daya dan layanan TI atau semacamnya dibeli dari vendor dan di-deliver kepada pelanggan melalui Internet. Dari sudut pandang pelanggan, ini berarti sumber daya TI berasal dari "awan" – karena pelanggan tidak perlu peduli di mana komputasi yang sebenarnya sedang terjadi. "Awan disini  adalah  suatu sistem komputasi yang cerdas, kompleks, dan hebat di langit sehingga orang bisa serasa sepert tinggal colok saja ke dalamnya," menurut perintis web browser  Marc Andreessen.