Skip to main content

Beberapa Alternatif Arsitektur Data Warehouse - Seri Data Warehouse (3)

Ada beberapa jenis arsitektur dasar untuk data warehouse. Yang paling umum adalah 2-tier dan 3-tier, tetapi kadang-kadang ada juga yang sederhana yaitu 1-tier. Hoffer et al. (2007) membedakan diantara arsitektur-arsitektir tersebut dengan membagi data wahouse menjadi tiga bagian:
  1. Data warehouse itu sendiri, yang berisi data dan software terkait
  2. Software untuk data akuisisi, yang mengekstrak data dari sistem-sistem legacy dan berbagai sumber eksternal, mengonsolidasikan dan men-summarize-kan, dan kemudian me-load data ke data warehouse
  3. Software klien/front-end, yang memungkinkan pengguna untuk mengakses dan menganalisa data dari data warehouse (engine DSS/BI/BA)

Apa kemiripan dan perbedaan utama antara arsitektur data warehouse 2-tier dan 3-tier?

Keduanya memberikan tampilan user yang sama melalui sistem pengguna yang mengakses aplikasi DSS/BI (Decision Support Systems/Business Intelligence) secara remote. Perbedaanya terletak dibelakang layar dan tidak tampak bagi user: dalam arsitektur 2-tier, engine aplikasi dan data warehouse berada pada mesin yang sama; sementara pada arsitektur 3-tier, berada pada mesin yang terpisah.

Pada arsitektur 2-tier, karena engine aplikasi dan data warehouse berada dalam mesin dan platform yang sama, karena itu pada umumnya lebih ekonomis dibanding 3-tier. Namun arsitektur 2-tier akan memiliki problem performa untuk data warehouse yang besar yang bekerja dengan aplikasi yang sangat intensif dengan data dalam menunjang pengambilan keputusan. 

Keuntungan dalam arsitektur 3-tier adalah karena ada pemisahan dalam fungsi data warehouse, sehingga mengurangi keterbatasan sumber daya (resources) dan memungkinkan untuk membuat data marts dengan mudah.


Bagaimana Web memberi dampak pada desain data warehouse?

Pada intinya adalah dengan memungkinkan adanya sistem data warehouse berbasis web. Data warehousing dan internet adalah dua teknologi kunci yang menawarkan solusi penting untuk mengelola data perusahaan. Integrasi kedua teknologi ini menghasilkan data warehousing berbasis web. Gambar berikut di bawah adalah data warehouse berbasis web.


Arsitektur tersebut adalah 3-tier dan meliputi PC client, Web server, dan application server. Pada sisi klien, pengguna memerlukan koneksi internet dan web browser (lebih dianjurkan yang java-enabled) melalui GUI (graphical user interface). Internet/inranet/extranet adalah media komunikasi antara klien dan server. Pada sisi server, web server digunakan untuk me-manage aliran informasi masuk dan keluar antara klien dan server. Web browser di-dukung  baik oleh data warehouse dan application server. Data warehouse berbasis web menawarkan beberapa keuntungan, antara lain kemudahan akses, bebas platform, dan biaya yang lebih murah.

Apa saja berbagai macam arsitektur alternatif bagi data warehouse?
  • Independent Data Marts Architecture
  • Data Mart Bus Architecture with linked Dimensional Data Marts
  • Hub-and-Spoke Data Mart Architecture / Dependent Data marts
  • Enterprise Data Warehouse Architecture
  • Federated Data Warehouse Architecture

Berikut di bawah adalah gambar beberapa alternatif arsitektur data warehouse yang diadopsi dari T. Ariyachandra dan H. Watson, “Which Data Warehouse Architecture Is Most Successful?” Business Intelligence Journal Vol. 11, No. 1, First Quarter, pp. 4-6

Berikut di bawah adalah keuntungan dan kekurangan dari beberapa alternatif arsitektur data warehouse:


Hal-hal apa yang perlu dipertimbangkan ketika memutuskan arsitektur mana yang akan digunakan dalam mengembangkan data warehouse?

1. Saling-ketergantungan informasi antara berbagai unit-unit organisasi
2. Informasi apa yang dibutuhkan oleh manajemen atas
3. Urgency akan kebutuhan data warehouse
4. Karakter dasar pekerjaan/tugas-tugas para penggunanya
5. Keterbatasan terhadap sumberdaya (resources)
6. View strategis data warehouse sebelum implementasi
7. Kompatibilitas dengan sistem sudah ada dan sedang digunakan (existing systems)
8. Kemampuan para staf IT internal organisasi
9. Hal-hal teknis
10. Faktor-faktor sosial/politik
11. Dll…

Arsitektur data warehouse mana yang terbaik? 

Tabel dibawah adalah kajian empiris yang dilakukan oleh Ariyachandra and Watson (2006) tentang skor rerata penilaian terhadap tingkat kesuksesan arsitektur. Yang menarik aalah kemiripan antara skor rerata untuk bus, hub-and-spoke, dan arsitektur tersentralisasi. Perbedaannya cukup kecil sehingga tidak ada klaim yang bisa dibuat bahwa arsitektur tertentu memiliki superioritas atas arsitektur yang lain, setidaknya berdasarkan perbandingan sederhana terhadap berbagai ukuran kesuksesan tersebut. 



Berikut seri artikel tentang data warehouse:
  1. Data Warehouse dan Beberapa Karakteristiknya
  2. Proses dalam Data Warehouse (Data Warehousing)
  3. Beberapa Alternatif Arsitektur Data Warehouse
  4. Proses Extract-Transform-Load (ETL) dalam Data Warehouse
  5. Pendekatan dalam Project Pengembangan Data Warehouse
  6. Data Warehouse Real-Time
  7. Administrasi dan Keamanan Data Warehouse

Comments

Popular posts from this blog

Pengertian Binding dalam Bahasa Pemrograman dan Kapan Terjadinya

Binding dimaksudkan sebagai pengikatan (association) antara suatu entity dengan atributnya, misalnya binding/pengikatan antara suatu variable dengan tipe datanya atau dengan nilainya, atau dapat juga antara suatu operasi dengan simbol, misalnya simbol + dikenali sebagai operasi penjumlahan atau simbol ^ dikenali sebagai operasi pangkat, dll.  Peristiwa binding dan kapan terjadinya binding (biasanya disebut dengan binding time ) berperan penting dalam membicarakan semantics suatu bahasa pemrograman. Beberapa kemungkinan binding time adalah:

Contoh proses normalisasi relasi dari UNF – 1NF – 2NF – dan 3NF

Dalam posting tulisan tentang: “Tujuan dan Manfaat Normalisasi dalam Perancangan Database” , kita sudah mempelajari tentang: “Apa itu normalisasi” dan “Mengapa kita perlu melakukan normalisasi”. Kedua pertanyaan itu sudah terjawab dalam tulisan tersebut.  Kemudian dalam posting tulisan tentang: “Konsep Ketergantungan Fungsional, Normalisasi, dan Identifikasi Primary Key dalam Perancangan Sistem Database” , kita sudah mempelajari suatu konsep penting yang digunakan untuk melakukan normalisasi, yaitu konsep ketergantungan fungsional yang terdiri dari ketergantungan penuh, ketergantungan parsial atau sebagian, dan ketergantungan transitif. Proses normalisasi pertama-tama dilakukan dengan mengidentifikasi adanya ketergantungan-ketergantungan tersebut dalam relasi-relasi dan kemudian menghilangkannya. Cara melakukan normalisasi, mengidentifikasi berbagai macam ketergantungan, dan menghilangkan ketergantungan pada relasi-relasi bisa dipelajari ulang dalam postingan tulisan d...

Latihan Soal Jawab Matematika Diskrit

Berikut di bawah ini adalah latihan soal jawab untuk matematika diskrit dengan topik-topik: Pernyataan Logika Circuits dan Ekspresi Boolean Argumen (valid/tidak valid) Teori Himpunan Permutasi Fungsi --o0o-- Pernyataan Logika 1. Buatlah tabel kebenaran untuk menentukan yang mana tautology dan yang mana contradiction dalam pernyataan logika (a) dan (b) di bawah ini: a. (p ∧ q) ∨ (∼p ∨ (p ∧ ∼q)) b.  (p ∧ ∼q) ∧ (∼p ∨ q)