Administrasi dan Keamanan Data Warehouse - Seri Data Warehouse (7)

Langkah-langkah apa yang perlu diambil suatu perusahaan untuk memastikan keamanan dan konfidensialitas data pelanggan dalam data warehousenya?

Sistem keamanan dalam data warehouse seharusnya berfokus pada empat area utama:
  1. Tahap 1: menetapkan prosedur dan kebijakan perusahaan tentang keamanan data yang efektif. Kebijakan keamanan yang efektif seharusnya dimulai dari atas dan dikomunikasikan dengan semua orang dalam perusahaan.
  2. Tahap 2: menerapkan berbagai prosedur dan teknik keamanan lojik untuk membatasi akses. Hal ini mencakup otentikasi user, kontrol akses, dan enkripsi.
  3. Tahap 3: membatasi terhadap akses fisik ke lingkungan data center.
  4. Tahap 4: menetapkan proses review kontrol internal yang efektif untuk keamanan dan privasi data. [Baca juga: manfaat data warehouse bisa dibaca di link ini]

Data Warehouse Real-Time - Seri Data Warehouse (6)

Apa yang dimaksud dengan real-time data warehouse (RDW)?

Real-time data warehouse adalah dimana data (di data warehouse) untuk pendukung kuputusan ter-update berbasiskan proses yang sedang berjalan ketika transaksi-transaksi bisnis terjadi; nama lainnya adalah active data warehouse. Berikut di bawah adalah gambar dari ilustrasi untuk real-time data warehouse atau active data warehouse. Kata "active" adalah enterprise data warehouse yang ditambah dengan elemen-elemen active yang ada di dalamnya. [Pengertian data warehouse dan beberapa karakteristiknya bisa dibaca disini]

Pendekatan dalam Project Pengembangan Data Warehouse - Seri Data Warehouse (5)

Project pengembangan data warehouse adalah suatu usaha yang besar bagi suatu perusahaan manapun dan lebih rumit dibandingkan dengan project implementasi dan memilih mainframe karena project ini melibatkan dan memberi pengaruh pada banyak departemen dan banyak interface input dan output dan mungkin saja merupakan bagian dari strategi bisnis CRM (customer relation management).  [Baca juga & bandingkan: Pendekatan dalam Project Pengembangan Business Intelligence]

Apa saja manfaat data warehouse?

Manfaat langsung meliputi:
  • Memungkinkan end-users untuk melakukan berbagaia analisa ekstensif dalam berbagai cara
  • Adanya data korporat/perusahaan yang menampilkan data yang sudah terkonsolidai dengan baik (satu versi data yang sudah valid)
  • Informasi yang lebih baik dan lebih tepat waktu.  Data warehouse memungkinkan pemrosesan informasi untuk dipindahkan dari sistem operasional yang mahal ke server-server yang murah, sehingga request informasi dari  end-users bisa diproses lebih cepat.
  • Peningkatan kinerja sistem. Data warehouse mengurangi pemrosesan di sistem produksi karena berbagai requirements dalam pelaporan sistem operasional dipindahkan ke sistem pendukung keputusan.
  • Penyederhanaan dalam akses data
  • Berbagai manfaat tak langsung muncul apabila end-users memanfaatkan berbagai manfaat langsung tersebut.

Proses ETL (Extract-Transform-Load) dalam Data Warehouse - Seri Data Warehouse (4)

Apa yang dimaksud dengan integrasi data (data integration)?

Integrasi data (atau data integration) adalah istilah umum dan luas (umbrella term) yang mencakup tiga proses yang menggabungkan data dari berbagai sumber data ke dalam data warehouse, tiga proses teresebut meliputi: 1) mengakses data, 2) menggabungkan berbagai macam view data yang berbeda-beda dan 3) menangkap perubahan data.

Beberapa Alternatif Arsitektur Data Warehouse - Seri Data Warehouse (3)

Ada beberapa jenis arsitektur dasar untuk data warehouse. Yang paling umum adalah 2-tier dan 3-tier, tetapi kadang-kadang ada juga yang sederhana yaitu 1-tier. Hoffer et al. (2007) membedakan diantara arsitektur-arsitektir tersebut dengan membagi data wahouse menjadi tiga bagian:
  1. Data warehouse itu sendiri, yang berisi data dan software terkait
  2. Software untuk data akuisisi, yang mengekstrak data dari sistem-sistem legacy dan berbagai sumber eksternal, mengonsolidasikan dan men-summarize-kan, dan kemudian me-load data ke data warehouse
  3. Software klien/front-end, yang memungkinkan pengguna untuk mengakses dan menganalisa data dari data warehouse (engine DSS/BI/BA)

Proses dalam Data Warehouse (Data Warehousing) - Seri Data Warehouse (2)

Bagaimanakah proses dalam data warehouse (atau disebut juga data warehousing)?

Proses dalam data warehouse atau data warehousing (catatan: istilah data warehouse mengacu ke tempat repository data sementara istilah data warehousing mengacu ke proses perjalanan data dari berbagai sumber data hingga masuk ke data warehouse) terdiri dari tahap-tahap berikut ini:
  1. Data di-import dari berbagai sumber data internal maupun eksternal
  2. Data di-cleansed atau dibersihkan dan diorganisir secara konsisten sesuai dengan kebutuhan perusahaan
  3. a) Data di-load atau di-export atau dimasukkan ke data warehouse enterprise, atau b). Data di-load/export/di masukkan ke data marts [tentang definisi data marts bisa dibaca pada artikel sebelumnya tentang  Data Warehouse dan Beberapa Karakteristiknya di link ini]
  4. a). Bila diinginkan, data marts dibuat sebagai subset atau bagian dari EDW (enterprise data warehouse), atau b) Data marts disatukan menjadi EDW
  5. Analisa dilakukan ketika diperlukan

Data Warehouse dan Beberapa Karakteristiknya - Seri Data Warehouse (1)

Apa yang dimaksud dengan data warehouse?

Secara literal, warehouse adalah gudang (yang berarti tempat menyimpan barang bekas/lama). Jadi secara literal data warehouse adalah gudang data (tempat menyimpan data lama). Pengertian Data warehouse (atau bisa disebut juga gudang data), dalam definisi yang paling sederhana adalah tempat kumpulan data (historis/lama) yang dibuat untuk mendukung pengambilan keputusan. Dengan definisi ini berarti kita berfokus pada hal-hal yang mendasar, dan mengabaikan karakteristik-karakteristik yang mungkin berbeda-beda dari satu data warehouse dengan data warehouse yang lainnya tetapi tidak terlalu memberikan kontribusi yang penting terhadap konsep dasar data warehouse.

Ada definisi lain yang lebih spesifik mengacu ke karakteristik data warehouse, yaitu: "data warehouse adalah sekumpulan data yang memiliki karakter-karakter berorientasi-subjek, terintegrasi, time-variant (time series), nonvolatile (bersifat tetap selamanya), yang berfungsi untuk mendukung proses pengambilan keputusan manajemen." Definisi ini menekankan hal-hal lebih spesifik, tetapi dalam setiap kasus tepatnya: sangatlah sulit, jika bukan tidak mungkin, untuk memahami suatu data warehouse yang tidak berorientasi subjek, terintegrasi, dll. [baca juga: Proses dalam Data Warehouse]

Contoh Soal Klasifikasi Dalam Data Mining: Decision Tree - Rules Based - Naive Bayesian

Di bawah ini adalah tabel yang berisi training data dari database karyawan.  Data ini sudah di-geralisasi-kan. Misalnya, “31…35” untuk usia berarti kisaran usia antara 31 hingga 35. Khusus untuk kolom  "jumlah", itu menunjukkan  jumlah tuples dari masing-masing data pada department, status, usia, dan gaji pada baris yang dimaksud

Contoh Soal dan Jawaban Ujian Data Mining

Essay:
1. Apa perbedaan supervised learning dan unsupervised learning? 
  
2. Berikut adalah decision tree


Suatu object X memiliki nilai-nilai atribut seperti berikut, X=(A=100; B=0; C=20). Klasifikasikan kelas apakah object X? 

Manfaat & Sejarah Batch Processing

Batch processing adalah eksekusi dari serangkaian program ("pekerjaan") dari komputer tanpa intervensi manual.
Jobs (pekerjaan) ditetapkan sedemikian rupa sehingga mereka dapat dijalankan sampai selesai tanpa interaksi manusia. Semua parameter input yang telah ditetapkan melalui suatu script, baris-baris perintah komputer, file-file kontrol, atau bahasa pemrograman untuk melakukan kontrol pekerjaan. Hal ini berbeda dengan "online" atau program interaktif yang mengajukan kepada pengguna untuk melakukan input ke sistem. Sebuah program membutuhkan satu set file data sebagai input, memproses data, dan menghasilkan satu set file data sebagai output. Lingkungan operasi semacam ini disebut sebagai "batch processing" karena data input dikumpulkan ke dalam batch atau sekumpulan record data dan setiap batch diproses sebagai satu unit. Output-nya adalah batch lain yang dapat digunakan kembali untuk komputasi

Batch processing memiliki manfaat:

Apakah Komputasi Awan Atau Cloud Computing itu?

Dalam beberapa tahun terakhir, komputasi awan telah menjadi topik hangat  untuk para  vendor TI dan eksekutif TI. Apa itu komputasi awan (atau cloud computing)? 

Komputasi awan artinya adalah bahwa kita bisa mendapatkan  berbagai sumber daya dan kapabilitas (misalnya, hardware, software, atau services) dari vendor TI melalui jaringan,pada umumnya jaringan Internet. "Awan" adalah sebuah metafora untuk internet, sehingga frasa "komputasi awan"  berarti bahwa sumber daya dan layanan TI atau semacamnya dibeli dari vendor dan di-deliver kepada pelanggan melalui Internet. Dari sudut pandang pelanggan, ini berarti sumber daya TI berasal dari "awan" – karena pelanggan tidak perlu peduli di mana komputasi yang sebenarnya sedang terjadi. "Awan disini  adalah  suatu sistem komputasi yang cerdas, kompleks, dan hebat di langit sehingga orang bisa serasa sepert tinggal colok saja ke dalamnya," menurut perintis web browser  Marc Andreessen. 

Jenis-jenis Atribut Data dalam Data Mining

Apa yang dimaksud dengan atribut?

Atribut adalah bagian data, yang mewakili karakteristik atau feature dari objek data. Atribut, dimensi, feature, dan variabel sering digunakan secara bergantian dalam literatur. Istilah dimensi ini umumnya digunakan dalam literatur data warehouse. Dalam literatur Machine learning cenderung menggunakan istilah feature, sementara statistik lebih menggunakan istilah variabel. 
Data mining dan para profesional database biasanya menggunakan istilah atribut, dan disini akan kita gunakan istilah atribut juga. 

Stay Hungry Stay Foolish - Steve Jobs

Transkrip Pidato Steve Jobs di Acara Wisuda Stanford University
~disampaikan pada 12 Juni 2005~

Saya merasa terhormat berada bersama Anda hari ini pada wisuda Anda yang merupakan salah satu universitas terbaik di dunia.

Kebenaran harus dikatakan, saya tidak pernah lulus dari perguruan tinggi. Dan ini adalah hal yang paling dekat yang pernah saya ikuti dalam upacara wisuda perguruan tinggi.

Hari ini saya ingin menyampaikan tiga cerita pengalaman hidup saya. Hanya itu. Tenang saja. Hanya tiga cerita.