Perbedaan antara skema bintang dan kepingan salju

Perbedaan antara skema bintang dan kepingan salju

Warehousing Data adalah sistem yang dirancang untuk menyimpan dan mengatur data di repositori pusat termasuk data dari sumber lain. Ini adalah konsep inti dari kecerdasan bisnis dalam model database relasional yang menggunakan teknik analitik untuk mengintegrasikan data bisnis ke dalam database pusat.

Ada dua model arsitektur umum yang digunakan dalam pergudangan data:

  • Skema Bintang
  • Skema kepingan salju

Keduanya adalah model database multidimensi yang umum digunakan untuk memenuhi kebutuhan database besar untuk tujuan analitik di gudang data nyata.

Kami menyajikan perbandingan yang tidak memihak antara keduanya untuk lebih memahami mana yang lebih baik dari yang lain.

Apa itu Skema Bintang?

Ini adalah model arsitektur yang paling umum dan diterima secara luas yang digunakan untuk mengembangkan gudang data dan mart data di mana data diatur ke dalam fakta dan dimensi. Ini adalah model arsitektur paling sederhana di mana satu tabel fakta digunakan untuk merujuk ke beberapa tabel dimensi, meniru pola bintang.

Seperti namanya, diagram menyerupai bintang dengan tabel fakta di tengah dan beberapa tabel dimensi memancar darinya, menciptakan pola seperti bintang.

Ia juga dikenal sebagai skema gabung bintang dan menyimpan semua atribut dimensi ke dalam satu tabel fakta yang didenormalisasi untuk dengan cepat menavigasi melalui set data multidimensi yang besar yang memperhitungkan waktu respons permintaan cepat.

Apa itu skema kepingan salju?

Ini adalah perpanjangan dari skema bintang dengan fungsionalitas tambahan. Tidak seperti skema bintang, tabel dimensi dalam skema kepingan salju dinormalisasi menjadi beberapa tabel terkait.

Model arsitektur mewakili pengaturan logis tabel dalam hierarki hubungan banyak-ke-satu di mana beberapa tabel dimensi dinormalisasi ke dalam tabel sub-dimensi, menyerupai pola seperti kepingan salju, karenanya namanya.

Ini adalah versi yang lebih kompleks dari skema bintang dengan lebih banyak gabungan antara tabel dimensi yang memperhitungkan waktu pemrosesan yang lambat untuk mengambil data yang berarti waktu respons kueri yang lambat. Ini meminimalkan redundansi data yang pada gilirannya meningkatkan kinerja kueri.

Perbedaan antara skema bintang dan kepingan salju

Arsitektur Skema Star and Snowflake

Dalam database relasional, skema bintang adalah model arsitektur paling sederhana yang digunakan untuk mengembangkan gudang data dan data multidimensi marts. Seperti namanya, model menyerupai bintang dengan titik yang memancar dari pusat yang berarti tabel fakta adalah pusat dan titik -titiknya adalah tabel dimensi. Seperti model dimensi lainnya, ini terdiri dari data dalam bentuk fakta dan dimensi. Skema kepingan salju, di sisi lain, adalah model arsitektur yang lebih kompleks yang mengacu pada database multidimensi dengan pengaturan logis tabel dalam bentuk kepingan salju.

Tabel dimensi

Skema kepingan salju sangat mirip dengan skema bintang kecuali dapat memiliki lebih dari satu tabel dimensi yang selanjutnya dinormalisasi ke dalam beberapa tabel terkait yang disebut sebagai tabel sub-dimensi. Itu mewakili berbagai tingkat hubungan yang bercabang menjadi pola kepingan salju. Namun, skema bintang menyimpan semua atribut terkait dimensi ke dalam satu tabel dimensi denormalisasi yang membuatnya mudah untuk dipahami dan menangani kueri yang lebih sederhana.

Model bisnis skema bintang dan kepingan salju

Tabel dimensi tidak dapat berisi baris duplikat dalam model database relasional untuk fakta sederhana bahwa itu dapat menciptakan ambiguitas dalam pengambilan. Setiap tabel harus memiliki kolom atau kombinasi kolom yang disebut kunci utama yang secara unik mengidentifikasi semua catatan tabel. Kunci asing adalah kolom atau sekelompok kolom yang menyediakan tautan antara dua tabel. Dalam skema bintang, setiap tabel dimensi memiliki kunci utama yang terkait dengan kunci asing di tabel fakta. Hirarki bisnis dalam skema kepingan salju diwakili oleh kunci utama/hubungan kunci asing antara tabel dimensi.

Integritas data dalam skema bintang dan kepingan salju

Perbedaan utama antara dua model database relasional adalah normalisasi. Tabel dimensi dalam skema bintang tidak dinormalisasi artinya model bisnis akan menggunakan lebih banyak ruang untuk menyimpan tabel dimensi dan lebih banyak ruang berarti lebih banyak catatan yang lebih berlebihan yang pada akhirnya akan menyebabkan ketidakkonsistenan. Skema kepingan salju, di sisi lain, meminimalkan redundansi data karena tabel dimensi dinormalisasi yang menyumbang catatan yang jauh lebih rendah. Hirarki bisnis dan dimensinya dipertahankan melalui hubungan integritas referensial dapat diperbarui secara independen di gudang data.

Performa kueri

Skema bintang memiliki lebih sedikit gabungan antara dimensi tabel dan tabel fakta dibandingkan dengan skema kepingan salju yang memiliki banyak gabungan yang menyumbang kompleksitas kueri yang lebih sedikit. Karena dimensi dalam skema bintang dihubungkan melalui tabel fakta sentral, ia memiliki jalur gabungan yang jelas yang berarti waktu respons kueri cepat dan waktu respons yang cepat berarti kinerja yang lebih baik. Skema kepingan salju memiliki jumlah gabungan yang lebih tinggi sehingga waktu respons kueri yang lebih lama yang menghasilkan pertanyaan yang lebih kompleks yang pada akhirnya mengkompromikan kinerja.

Skema bintang vs. Skema Kepingan Salju: Bagan Perbandingan


Ringkasan Skema Kepingan Salju Bintang

Keduanya adalah model arsitektur yang paling umum dan diadopsi secara luas yang digunakan untuk mengembangkan gudang basis data dan data mart. Namun, setiap model bisnis memiliki bagian pro dan kontra yang adil. Sementara skema bintang adalah model multidimensi paling sederhana yang digunakan untuk mengatur data menjadi fakta dan dimensi, ini sangat ideal untuk mengembangkan data mart yang melibatkan hubungan yang kurang kompleks. Skema Kepingan Salju adalah representasi logis dari tabel dalam database multidimensi di mana dimensi disimpan dalam tabel sub-dimensi. Perbedaan utama antara keduanya adalah normalisasi. Tabel dimensi dalam skema kepingan salju sepenuhnya dinormalisasi menjadi beberapa tabel pencarian, sedangkan dalam skema bintang, tabel dimensi didenormalisasi menjadi satu tabel fakta sentral.