PENGERTIAN DATA MART - PerBEDAAN DATA MART VS DATA WEREHOUSE
PENGERTIAN DATA MART,STRUKTUR,JENIS,FUNGSI DAN PERBEDAANNYA DENGAN DATA WEREHOUSE- Diera saat ini dimana big data dan analytical terhadap pasar menjadi begitu populer,data mart adalah salah satu kunci yang efisien dalam mentranformasikan informasi ke dalam bentuk yang lebih terstruktur dan mudah untuk dipahami.Data Werehouse biasanya dipakai untuk menganalisis data yang cakupanya sedemikian besar,dan ini biasanya dipakai oleh korporasi yang besar dan dominan.Lalu bagaimana dengan bisnis kecil sekelas UKM dalam memproses data tanpa perlu memikirkan hal-hal rumit dalam mengakses data?maka Data Mart adalah jawabannya
Data mart adalah database yang berorientasi subject yang sering dipartisi dari data werehouse.Subject dari data yang disimpan dalam data mart biasanya sejajar dengan unit bisnis tertentu seperti penjualan, keuangan, atau pemasaran. Data mart mempercepat proses bisnis dengan memungkinkan akses ke informasi yang relevan di gudang data atau penyimpanan data operasional dalam beberapa hari, berbulan-bulan atau bahkan lebih lama.Karena data mart hanya menggunakan data yang bisa langsung diaplikasikan untuk area bisnis tertentu,sehingga mampu menekan biaya dan analisis terhadap data tersebut bisa ditindak lanjuti dengan cepat.
Perbedaan Data Mart dan Data Warehouse
Data mart dan Data Werehouse keduanya adalah repositori yang sangat terstruktur di mana data disimpan dan dikelola sampai diperlukan.Bagaimanapun,keduanya mempunyai perbedaan dalam hal penyimpanan data,data werehouse digunakan untuk pemrosesan dari data pusatberasal cakupan yang luas,sedangkan Data Mart untuk melayani permintaan data dari divisi yang lebih spesifik untuk fungsi tertentu.Karena data werehouse memiliki data dari seluruh korporasi atau perusahaan,maka merupakan pilihan tepat untuk memberlakukan kontrol yang ketat mengenai siapa saja yang bisa mengaksesnya.Selain itu menquery data yang dibutuhkan dalam data werehouse merupakan hal yang sulit.
Dengan demikian, tujuan utama data mart adalah untuk mengisolasi — atau mempartisi — sekumpulan data yang lebih kecil dari keseluruhan untuk menyediakan akses data yang lebih mudah bagi konsumen akhir
Data mart dapat dibuat dari data werehouse yang sudah ada.dari atas ke bawah ataupun dari sumber yang lain,seperti data dari dalam ataupun luar sistem operasi.Mirip dengan data werehouse, ini merupakan basis data relasional yang menyimpan data transaksional (nilai waktu, urutan numerik, referensi ke satu atau lebih objek) dalam kolom dan baris sehingga memudahkan untuk mengatur dan mengaksesnya secara lebih efisien dan cepat tentunya
Di sisi lain, unit bisnis yang terpisah dapat membuat data mart mereka sendiri berdasarkan persyaratan data mereka sendiri. Jika kebutuhan bisnis menentukan, beberapa data mart dapat digabung bersama untuk membuat data warehouse tunggal. Ini adalah pendekatan pengembangan dari bawah ke atas
TABEL PERBANDINGAN ANTARA DATA MART DAN DATA WEREHOUSE
Perbandingan
|
DATA MART
|
DATA WEREHOUSE
|
ukuran
|
< 100 GB
|
100 GB +
|
subject
|
Subject Tunggal
|
Subject Banyak
|
cakupan
|
UKM atau bisnis yang kecil
|
Bisnis besar atau enterprise
|
Sumber data
|
Beberapa sumber
|
Banyak sumber
Data
|
Integrasi data
|
Satu subject
area
|
Semua Data
|
Waktu untuk membangun
|
Menit,minggu,bulan
|
Sekian bulan bahkan bisa bertahun tahun
|
Tiga jenis Data Mart
Terdapat tiga jenis data mart : dependent atau bergantung dengan data werehouse,data mart mandiri atau independent ,serta data mart hybrid atau penggabungan diantara keduanya.Semuanya dapat dikategorikan berdasarkan hubunganya dengan data werehouse dan sumber data yang digunakan dalam sebuah sistem
1.Data Mart Dependent
Dependent data mart adalah data yang dihasilkan dari data werehouse yang ada.membentuk hirarki dari atas ke bawah yang dimulai dengan menyimpan semua data bisnis di satu lokasi pusat, kemudian mengekstraksi bagian data yang terdefinisi dengan jelas ketika diperlukan untuk analisis.
Untuk membentuk sebuah gudang data, satu set data spesifik dikumpulkan (dibentuk menjadi sebuah cluster) dari gudang data-direstrukturisasi, kemudian dimuat ke data mart di mana ia dapat di-query. Terdapat tiga macam data mart dependent
- Logical view – tabel atau tampilan yang secara logis terpisah dari data werehouse
- Physical Subset – Data hasil ekstraksi yang secara fisik terpisah menjadi database yang diambil dari data werehouse
- Data Granular – level terendah dari target data yang telah diatur dalam server data werehouse sebagai single point berdasarkan semua turunan data mart yang telah dibuat
2.Data Mart Independent
Data Mart independent adalah sistem yang berdiri sendiri,atau dibuat tanpa menggunakan gudang data (data werehouse),yang hanya berfokus pada area subject atau fungsi tertentu.Data diekstraksi dari luar ataupun dari dalam sumber data atau bahkan bisa dari keduanya,diproses kemudian dimuat ke dalam repositori data mart dimana data tersebut disimpan dan bisa dipanggil saat dibutuhkan untuk analisis
Data mart independen tidaklah sulit untuk dibuat dan dikembangkan.salah satu keuntungannya adalah dapat dibuat untuk tujuan jangka pendek,tapi mungkin menjadi agak rumit ketika dikelola karena masing masing data memiliki ETL toll dan logika yang perlu untuk dikembangkan dan kemudian menjadi lebih kompleks pada akhirnya.
3.Data Marts Hybrid (Gabungan)
Data Mart hybrid adalah gabungan dari data yang sudah ada dalam data gudang (werehouse) dan sumber lain.Ini adalah penggabungan antara kecepatan dan fokus pengguna akhir dari hirarki atas ke bawah dan mendapatkan keuntungan dari semua data yang terintegrasi
Struktur Data Mart
Mirip dengan data werehouse,data mart juga bisa ditampilkan dalam skema bintang,snowflake,kubah atau skema yang lain dalam bentuk cetak-biru.Biasanya para Tim IT yang berurusan dengan data akan menggunakan diagram bintang yang terdiri dari satu atau lebih tabel.Keuntungan menggunakan skema bintang adalah bahwa lebih sedikit gabungan yang diperlukan saat menulis kueri, karena tidak ada ketergantungan antara dimensi. Ini menyederhanakan proses permintaan ETL sehingga memudahkan analis untuk mengakses dan menavigasi.
Dalam skema snowflake,dimensi tidak jelas saat didefinisikan,ini biasanya membantu mengurangi redundansi data dan melindungi integritas data.Ini dapat mengurangi penggunaan memori untuk menyimpan tabel dimensi,tapi memiliki struktur yang rumit dan sulit untuk dikelola
Keuntungan Data Mart
- Mampu mengelola big data
- Mendapatkan data secara akurat dan bernilai
- Dapat diakses secara efisien
- Sebagai alternatif dari data werehouse yang dikenal mahal
- Dapat meningkatkan perfoman gudang data
- Dapat dikelola oleh departemen yang berbeda dan mereka dapat mengkontrol data mereka sendiri
- Set up yang mudah dan sederhana
- Entri yang mudah
Posting Komentar untuk "PENGERTIAN DATA MART - PerBEDAAN DATA MART VS DATA WEREHOUSE"