Apa yang dimaksud dengan integrasi data (data integration)?
Integrasi data (atau data integration) adalah istilah umum dan luas (umbrella term) yang mencakup tiga proses yang menggabungkan data dari berbagai sumber data ke dalam data warehouse, tiga proses teresebut meliputi: 1) mengakses data, 2) menggabungkan berbagai macam view data yang berbeda-beda dan 3) menangkap perubahan data.
Apa yang dimaksud dengan tiga tahap dalam proses ETL (Extract-Transform-Load)?
- Extraction: adalah proses memilih data dari satu atau beberapa sumber dan membaca/mengakses data yang dipilih tersebut.
- Transformation: adalah proses mengonversi data dari bentuk awal/asli dalam bentuk apapun itu menjadi bentuk yang sesuai dengan kebutuhan data warehouse. Tahap ini seringkali juga mencakup hal-hal seperti pembersihan data untuk menghilangkan berbagai error yang mungkin terjadi.
- Loading: adalah proses menaruh/memasukkan data yang sudah dikonversi/transformasi ke dalam data warehouse.
[Baca juga: Perancangan ETL disini dan Pengembangan ETL disni]
Mengapa proses ETL (Extract-Transform-Load) sangat penting dalam proses data warehouse?
Karena ETL (Extract-Transform-Load) adalah rangkaian proses dimana data di-load ke dalam data warehouse, sehingga data warehouse tidak mungkin ada tanpa adanya proses ETL. Proses ETL juga sangat berperan terhadap kualitas data dalam data warehouse.
Berikut seri artikel tentang data warehouse:
- Data Warehouse dan Beberapa Karakteristiknya
- Proses dalam Data Warehouse (Data Warehousing)
- Beberapa Alternatif Arsitektur Data Warehouse
- Proses Extract-Transform-Load (ETL) dalam Data Warehouse
- Pendekatan dalam Project Pengembangan Data Warehouse
- Data Warehouse Real-Time
- Administrasi dan Keamanan Data Warehouse
Comments
Post a Comment