Skip to main content

Analisa Data: Langkah 5 Dalam Siklus Hidup Proyek Pengembangan BI

Tahap 3: Analisa Bisnis

Langkah 5: Analisa Data

Berbagai aktivitas dalam analisa data
Aktivitas-aktivitas pada analisa data tidak harus dilakukan secara linear. Gambar disamping menunjukkan aktivitas-aktivitas mana saja yang dapat dilakukan secara bersamaan. Berikut di bawah ini adalah deskripsi singkat aktivitas-aktivitas yang berhubungan dengan Langkah 5, yaitu: Analisa Data.

1. Menganalisis sumber-sumber data eksternal.

Selain memerlukan data operasional internal, banyak aplikasi BI memerlukan data dari sumber-sumber eksternal. Penggabungan data eksternal dengan data internal menghadirkan tantangan tersendiri. Data eksternal sering kotor (kacau) dan tidak lengkap, dan biasanya tidak mengikuti format yang sama atau struktur kunci seperti data internal. Identifikasikan dan atasi perbedaan-perbedaan tersebut pada langkah ini.

2. Saring/perbaiki kembali model data logikal.

Suatu model data logikal tingkat tinggi yang spesifik terhadap proyek tertentu harus sudah dibuat pada salah satu langkah sebelumnya. Selain itu, beberapa atau semua data internal dan eksternal mungkin telah dimodelkan pada proyek-proyek lain dan mungkin sudah menjadi bagian dari model data logikal perusahaan. Dalam kasus seperti ini, ekstraklah sebagian dari model data logikal perusahaan yang bisa mewakili dan kemudian kembangkan dengan objek-objek data yang baru, relationship-relationship data yang baru, dan eleman-elemen data yang baru. Jika data yang dibutuhkan belum dimodelkan sebelumnya, buatlah model data logikal yang baru untuk lingkup proyek BI ini. Ini harus mencakup semua elemen-elemen data internal maupun eksternal.

3. Menganalisa kualitas data.

Pada saat yang sama bahwa model data logikal dibuat atau diperluas, kualitas file-file sumber internal dan eksternal dan database-database sumber harus dianalisa secara terperinci. Hal ini sangat umum bahwa data operasional yang ada saat ini tidak sesuai dengan business rules dan business policies yang sudah dinyatakan. Banyak elemen data yang digunakan untuk beberapa tujuan atau hanya dibiarkan kosong. Identifikasilah semua perbedaan ini dan masukkan semuanya ke dalam model data logikal.

4. Kembangkan/perluas model data logikal perusahaan.

Setelah model data logikal yang spesifik terhadap proyek relatif stabil, gabungkan kembali ke model data logikal perusahaan. Selama proses penggabungan ini perbedaan data lainnya atau berbagai inkonsistensi dapat diidentifikasi. Itu semua akan dikembalikan ke proyek BI untuk diadakan resolusi.

5. Selesaikan/solusikan berbagai perbedaan data.

Kadang-kadang berbagai perbedaan data yang ditemukan selama analisa data melibatkan perwakilan bisnis lainnya dari proyek-proyek yang lain. Dalam kasus seperti ini, panggillah perwakilan bisnis lainnya tersebut serta pemilik data untuk bekerja bersama mengatasi perbedaan data ini. Entah mereka akan menemukan subtipe baru dari sah dari suatu objek data atau elemen data baru, yang harus dimodelkan seperti itu, atau mereka harus menyelesaikan dan men-standarisasi-kan berbagai macam inkonsistensi.

6. Tuliskan berbagai spesifikasi pembersihan data.

Setelah semua masalah data diidentifikasi dan dimodelkan, tulislah berbagai spesifikasi tentang bagaimana cara membersihkan data. Spesifikasi ini harus dalam bahasa inggris biasa sehingga dapat divalidasi oleh pemilik data dan oleh orang-orang bisnis yang akan menggunakan data.

Seri Siklus Hidup Proyek Pengembangan BI (Business Intelligence):

Comments

Popular posts from this blog

Pengertian Binding dalam Bahasa Pemrograman dan Kapan Terjadinya

Binding dimaksudkan sebagai pengikatan (association) antara suatu entity dengan atributnya, misalnya binding/pengikatan antara suatu variable dengan tipe datanya atau dengan nilainya, atau dapat juga antara suatu operasi dengan simbol, misalnya simbol + dikenali sebagai operasi penjumlahan atau simbol ^ dikenali sebagai operasi pangkat, dll.  Peristiwa binding dan kapan terjadinya binding (biasanya disebut dengan binding time ) berperan penting dalam membicarakan semantics suatu bahasa pemrograman. Beberapa kemungkinan binding time adalah:

Contoh proses normalisasi relasi dari UNF – 1NF – 2NF – dan 3NF

Dalam posting tulisan tentang: “Tujuan dan Manfaat Normalisasi dalam Perancangan Database” , kita sudah mempelajari tentang: “Apa itu normalisasi” dan “Mengapa kita perlu melakukan normalisasi”. Kedua pertanyaan itu sudah terjawab dalam tulisan tersebut.  Kemudian dalam posting tulisan tentang: “Konsep Ketergantungan Fungsional, Normalisasi, dan Identifikasi Primary Key dalam Perancangan Sistem Database” , kita sudah mempelajari suatu konsep penting yang digunakan untuk melakukan normalisasi, yaitu konsep ketergantungan fungsional yang terdiri dari ketergantungan penuh, ketergantungan parsial atau sebagian, dan ketergantungan transitif. Proses normalisasi pertama-tama dilakukan dengan mengidentifikasi adanya ketergantungan-ketergantungan tersebut dalam relasi-relasi dan kemudian menghilangkannya. Cara melakukan normalisasi, mengidentifikasi berbagai macam ketergantungan, dan menghilangkan ketergantungan pada relasi-relasi bisa dipelajari ulang dalam postingan tulisan d...

Latihan Soal Jawab Matematika Diskrit

Berikut di bawah ini adalah latihan soal jawab untuk matematika diskrit dengan topik-topik: Pernyataan Logika Circuits dan Ekspresi Boolean Argumen (valid/tidak valid) Teori Himpunan Permutasi Fungsi --o0o-- Pernyataan Logika 1. Buatlah tabel kebenaran untuk menentukan yang mana tautology dan yang mana contradiction dalam pernyataan logika (a) dan (b) di bawah ini: a. (p ∧ q) ∨ (∼p ∨ (p ∧ ∼q)) b.  (p ∧ ∼q) ∧ (∼p ∨ q)