Data Warehouse Real-Time - Seri Data Warehouse (6)

Apa yang dimaksud dengan real-time data warehouse (RDW)?

Real-time data warehouse adalah dimana data (di data warehouse) untuk pendukung kuputusan ter-update berbasiskan proses yang sedang berjalan ketika transaksi-transaksi bisnis terjadi; nama lainnya adalah active data warehouse. Berikut di bawah adalah gambar dari ilustrasi untuk real-time data warehouse atau active data warehouse. Kata "active" adalah enterprise data warehouse yang ditambah dengan elemen-elemen active yang ada di dalamnya. [Pengertian data warehouse dan beberapa karakteristiknya bisa dibaca disini]


Apa saja manfaat dari real-time data warehouse (RDW)?

Manfaat dari real-time data warehouse (RDW) memperluas manfaat data warehouse tradisional, secara umum, hingga ke pengambilan keputusan hingga level taktis, dan mungkin saja sampai level operasional. RDW mempersenjatai penggunanya yang berinteraksi langsung dengan para pelanggan dan supplier dengan menyediakan informasi real-time untuk mengambil keputusan. Hal ini juga bisa diperluas hingga sampai ke level pelanggan dan supplier itu sendiri,, dan dengan demikian berpengaruh  pada hampir semua aspek customer service, SCM (supply chain management), logistik dan seterusnya. Hal ini juga bisa memudahkan aktivitas e-business, comtohnya ketika soutlet-outlet penjualan seperti overstock.com, woot.com dan steepcheap.com menggunakan data historis untuk memberi harga barang-barang diskon baru.

Apa perbedaan utama antara data warehouse tradisional (TDW) dan real-time data warehouse (RDW)?
  1. Data warehouse tradisional (TDW) digunakan untuk pengambilan keputusan-keputusan strategis (dan terkadang taktis); sementara RDW digunakan untuk pengambilan keputusan strategis dan taktis (terkadang operasional).
  2. Hasil yang didapat karena menggunakan TDW bisa sulit diukur; sementara hasil yang didapat dengan menggunakan RDW diukur dengan data operasional.
  3. Rerata pemuktahiran data dalam TDW berkisar antara perhari hingga perbulan; sementara RDW hanya dalam per beberapa menit saja.
  4. Data-data bersifat summary dalam TDW seringkali merupakan hal tepat; sementara dalam RDW harus memerlukan data detil.
  5. TDW hanya untuk menunjang sebagian kecil pengguna di level atas suatu perusahaan; sementara RDW menunjang banyak pengguna, mungkin hingga ribuan.
  6. TDW biasanya menggunakan pelaporan yang bersifat terbatas untuk sekedar konfirmasi keakuratan data atau pengecekan pola; sementara RDW memerlukan pelaporan yang bersifat fleksibel dan ad-hoc.
  7. Para pengguna TDW biasanya terdiri dari orang-orang yang memegang jabatan (level atas), para karyawan/pekerja pengetahuan (bekerja menggunakan pengetahuan, misalnya analis, konsultan, penasihat, dll), para manajer, dan para pengguna internal lainnya; sementara RDW digunakan oleh staf operasional, call center, mungkin juga pengguna eksternal.

Berikut adalah gambar ringkasan perbedaan antara data warehouse tradisional dan data warehouse real-time atau active data warehouse. [Baca juga: Perbedaan Database vs Data Warehouse]
Perbandingan data warehouse tradisional dan data warehouse active/real-time

Faktor-faktor apa yang menjadi pendorong munculnya real-time data warehouse?
  • Perusahaan seringkali tidak sabar menunggu sepanjang hari atas data operasional mereka untuk di-load ke data warehouse untuk di analisa
  • Data warehouse tradisional menangkap gambaran kondisi ‘fixed’ perusahaan dan bukan data real-time yang bersifat incremental yang menunjukkan setiap perubahan kondisi dan pola-pola yang hampir analog sepanjang waktu.
  • Dengan data warehouse tradisional yang menerapkan arsitektur hub-and-spoke, yang selalu menjaga metadata dalam kondisi selalu sinkron adalah hal yang sulit. Hal tersebut juga sangat mahal untuk dikembangkan, di-maintain, dan menjaga keamanan banyak sistem dibandingkan dengan satu data warehouse saja yang besar sehingga data tersentralisasi untuk dianalisa dengan berbagai tool BI/BA.
  • Dalam banyak kasus, proses load berbasiskan sistem batch [sistem batch bisa dibaca disni] yang dilakukan setiap malam, memerlukan setup ETL dan power yang besar untuk memroses proses loading tiap malam, dan proses-proses tersebut bisa jadi akan memakan waktu sangat lama. EAI (Enterprise Application Integration) dengan sekumpulan data real-time bisa mengurangi atau menghilangkan banyak proses batch tersebut.

1 comment: