Banyak orang yang sudah familiar dengan berbagai sistem database relational, jadi untuk memahami tentang apa itu data warehouse, cara yang paling mudah adalah dengan membandingkan antara kedua jenis sistem ini.
Tugas utama sistem database operasional adalah untuk melakukan pemrosesan query dan transaksi secara online (online = database dalam kondisi aktif). Sistem-sistem seperti ini disebut dengan sistem-sistem 'On-Line Transactional Processing' (OLTP), yang artinya secara harafiah digunakan untuk memroses transaksi. Sistem-sistem ini pada umumnya meng-cover operasi sehari-hari suatu organisasi seperti pembelian, inventori, manufaktur, perbankan, penggajian, registrasi/pendaftaran, akuntansi, dsb, dsb. [Baca juga: topik-topik terkait database disini]
Sistem-sistem data warehouse, sebaliknya, melayani para pengguna pengetahuan (insight) atau biasa juga disebut 'knowledge workers', yaitu orang-orang yang menganalisa data untuk mendukung proses pengambilan suatu keputusan. Sistem-sistem seperti ini mengorganisasi dan menyajikan data dengan berbagai macam format untuk menampung berbagai macam kebutuhan para pengguna yang berbeda-beda. Sistem-sistem seperti ini disebut dengan 'On-Line Analytical Processing' (OLAP), yang secara harafiah artinya digunakan untuk memroses analisa. [Baca juga: topik-topik terkait data warehouse disini]
Perbedaan utama fitur-fitur antara OLTP (database) dan OLAP (data warehouse) kurang lebih diringkas seperti berikut:
- Pengguna dan Orientasi Sistem:
- Sistem OLTP (database) adalah 'customer-oriented' (berorientasi pelanggan) dan digunakan untuk pemrosesan query dan transaksi oleh para klerk (pramuniaga, kasir, dsb), klien, dan para profesional IT.
- Sistem OLAP (data warehouse) adalah 'market-oriented' (berorientasi pasar) dan digunakan untuk analisa data oleh para 'knowledge workers' (orang-orang yang menganilsa data untuk menemukan insight/pengetahuan) termasuk para manajer, eksekutif, dan para analis data.
- Konten data:
- Sistem OLTP me-manage data saat ini, yang pada dasarnya, terlalu detil untuk digunakan secara mudah untuk proses mengambil keputusan.
- Sistem OLAP me-manage data historis yang jumlahnya sangat besar, menyediakan berbagai fasilitas untuk 'summarization' dan 'aggregation' (misalnya menjumlah total penjualan dan mengombinasikan penjualan per tahun per area, dsb, dsb), dan menyimpan dan me-manage informasi pada tingkat granularitas yang berbeda-beda. Fitur-fitur inilah yang membuat data lebih mudah digunakan untuk proses pembuatan keputusan.
- Desain database:
- Sistem OLTP biasanya mengadopsi pemodelan data 'entity-relationship' (ER) dan desain database berorientasi aplikasi (application-oriented).
- Sistem OLAP biasanya mengadopsi pemodelan 'star' atau 'snowflake' dan desain database berorientasi subject (subject-oriented; subject = misalnya, penjualan, produk, dsb, dsb, bukan transaksi).
- View:
- Sistem OLTP fokus utamanya pada data saat ini di dalam suatu perusahaan/enterprise atau departemen, tanpa mengacu ke data historis atau data di organisasi lainnya.
- Sebaliknya, sistem OLAP seringkali menjangkau berbagai versi skema database, karena proses evolusioner dari suatu organisasi. Sistem OLAP juga berkaitan dengan informasi yang berasal dari organisasi yang berbeda, yang meng-integrasikan dari banyak tempat penyimpanan data. Karena volumenya yang sangat besar, data OLAP disimpan pada beberapa media penyimpanan.
- Pola akses:
- Pola akses sistem OLTP utamanya terdiri dari transaksi atomik yang pendek. Sistem sepeti ini memerlukan mekanisme 'concurency control' dan 'recovery'.
- Tetapi, akses ke sistem OLAP kebanyakan adalah operasi yang 'read-only' (karena sebagaian besar data warehouse menyimpan data historis dibanding data terbaru), meskipun kebanyakan bisa berupa query-query yang kompleks.
Fitur-fitur lainnya yang membedakan antara sistem-sistem OLTP vs OLAP meliputi size database, frekwensi operasi, dan metrik-metrik kinerja, diringkas dalam tabel berikut ini:
Fitur
|
OLTP
|
OLAP
|
Karakteristik
|
Pemrosesan operasional
|
Pemrosesan informasional
|
Orientasi
|
Transaksi
|
Analisa
|
Pengguna
|
Klerk (kasir, pramuniaga, dll), DBA, professional database
|
Knowledge worker (misalnya, manager, eksekutif,
analis data)
|
Fungsi
|
Operasinal sehari-hari
|
Untuk kebutuhan infomasi jangka panjang untuk pendukung keputusan
|
Desain DB
|
Berbasis ER, berorientasi aplikasi
|
Skema star/snowflake, historis berorientasi subjek,
akurasi yang di-maintain sepanjang waktu
|
Summarization
|
Primitif, sangat mendetil
|
ter-summarisasi, terkonsolidasi
|
View
|
Mendetil, relational
|
tersummarisasi, multidimensi
|
Unit kerja
|
Pendek, transaksi sederhana
|
Query yang kompleks
|
Akses
|
Read/write
|
Pada umumnya ‘read’
|
Fokus
|
Data masuk
|
Informasi keluar
|
Operasi
|
Index/hash pada ‘primary key’
|
Banyak ‘scan/pemindaian/cek’
|
Jumlah ‘record’ yang di akses
|
Puluhan
|
Jutaan
|
Jumlah pengguna
|
Ribuan
|
Ratusan
|
Ukuran DB
|
GB atau lebih
|
>= TB
|
Prioritas
|
Performa/kinerja dan availibilitas yang tinggi
|
Fleksibilitas yang tinggi, otonomi pengguna
|
Metrik
|
Transaction throughput (kecepatan transaksi)
|
Query throughput (kecepatan query)
dan response time (kecepatan respon)
|
Post artikel terkait:
Comments
Post a Comment