Skema kepingan salju vs. Skema Bintang
- 4722
- 1013
- Rodney Hegmann
Saat memilih skema database untuk gudang data, kepingan salju Dan skema bintang cenderung menjadi pilihan populer. Perbandingan ini membahas kesesuaian bintang VS. Skema kepingan salju dalam skenario yang berbeda dan karakteristiknya.
Grafik perbandingan
Skema kepingan salju | Skema Bintang | |
---|---|---|
Kemudahan Pemeliharaan / Perubahan | Tidak ada redundansi, jadi skema kepingan salju lebih mudah dipelihara dan diubah. | Memiliki data yang berlebihan dan karenanya kurang mudah dipelihara/diubah |
Kemudahan penggunaan | Pertanyaan yang lebih kompleks dan karenanya kurang mudah dimengerti | Kompleksitas kueri yang lebih rendah dan mudah dimengerti |
Performa kueri | Lebih banyak kunci asing dan karenanya waktu eksekusi permintaan yang lebih lama (lebih lambat) | Lebih sedikit jumlah kunci asing dan karenanya waktu eksekusi kueri yang lebih pendek (lebih cepat) |
Jenis DataWarehouse | Bagus untuk digunakan untuk inti DataWarehouse untuk menyederhanakan hubungan yang kompleks (banyak: banyak) | Bagus untuk datamarts dengan hubungan sederhana (1: 1 atau 1: banyak) |
Bergabung | Jumlah gabungan yang lebih tinggi | Lebih sedikit bergabung |
Tabel dimensi | Skema kepingan salju mungkin memiliki lebih dari satu tabel dimensi untuk setiap dimensi. | Skema bintang hanya berisi tabel dimensi tunggal untuk setiap dimensi. |
Kapan harus digunakan | Saat tabel dimensi berukuran relatif besar, penguput salju lebih baik karena mengurangi ruang. | Saat tabel dimensi mengandung lebih sedikit jumlah baris, kita dapat memilih skema bintang. |
Normalisasi/ de-normalisasi | Tabel dimensi dalam bentuk yang dinormalisasi tetapi tabel fakta dalam bentuk yang tidak dinormalisasi | Tabel dimensi dan fakta dalam bentuk yang tidak dinormalisasi |
Model data | Pendekatan bottom up | Pendekatan atas ke bawah |
Contoh
Pertimbangkan database untuk pengecer yang memiliki banyak toko, dengan masing -masing toko menjual banyak produk dalam banyak kategori produk dan dari berbagai merek. Gudang data atau data mart untuk pengecer semacam itu perlu memberikan analis kemampuan untuk menjalankan laporan penjualan yang dikelompokkan berdasarkan toko, tanggal (atau bulan, kuartal atau tahun), atau kategori atau merek produk.
Contoh Skema Bintang
Jika data ini menggunakan skema bintang, itu akan terlihat sebagai berikut:
Contoh skema bintangTabel fakta akan menjadi catatan transaksi penjualan, sementara ada tabel dimensi untuk tanggal, toko dan produk. Tabel dimensi masing -masing terhubung ke tabel fakta melalui kunci utama mereka, yang merupakan kunci asing untuk tabel fakta. Misalnya, alih -alih menyimpan tanggal transaksi aktual di baris tabel fakta, date_id disimpan. Date_id ini sesuai dengan baris unik dalam tabel DIM_DATE, dan baris itu juga menyimpan atribut lain dari tanggal yang diperlukan untuk pengelompokan dalam laporan. e.G., hari dalam seminggu, bulan, kuartal tahun ini dan seterusnya. Data didenormalisasi untuk pelaporan yang lebih mudah.
Inilah bagaimana seseorang akan mendapatkan laporan tentang jumlah televisi yang dijual berdasarkan merek dan negara dengan bantuan gabungan batin.
Contoh skema kepingan salju
Skenario yang sama juga dapat menggunakan skema kepingan salju, dalam hal ini akan disusun sebagai berikut:
Contoh Skema Kepingan Salju (klik untuk memperbesar)Perbedaan utama, bila dibandingkan dengan skema bintang, adalah bahwa data dalam tabel dimensi lebih dinormalisasi. Misalnya, alih -alih menyimpan bulan, seperempat dan hari dalam seminggu di setiap baris tabel DIM_DATE, ini selanjutnya dibagi menjadi tabel dimensi mereka sendiri. Demikian pula untuk tabel DIM_STORE, negara bagian dan negara adalah atribut geografis yang satu langkah dihapus - alih -alih disimpan dalam tabel DIM_STORE, mereka sekarang disimpan dalam tabel DIM_GEOGRAFI terpisah yang terpisah.
Laporan yang sama - jumlah televisi yang dijual berdasarkan negara dan merek - sekarang sedikit lebih rumit daripada dalam skema bintang:
Kueri SQL untuk mendapatkan jumlah produk yang dijual berdasarkan negara dan merek, saat database menggunakan skema kepingan salju.