Perbedaan antara varian sampel & varian populasi
- 2637
- 313
- Mr. Jordan Gusikowski
Penjelasan
Dalam statistik istilah pengambilan sampel mengacu pada pemilihan bagian dari data statistik agregat untuk tujuan mendapatkan informasi yang relevan tentang keseluruhan. Agregat atau seluruh informasi statistik tentang karakter tertentu dari semua anggota yang dicakup oleh investigasi disebut 'populasi' atau 'alam semesta'. (Das, n.G., 2010). Bagian terpilih dari populasi yang digunakan untuk mendapatkan karakteristik populasi atau alam semesta disebut sebagai 'sampel'. Populasi diambil untuk dibuat dari unit atau anggota individu, dan beberapa unit termasuk dalam sampel. Jumlah total unit populasi disebut ukuran populasi, dan sampel disebut ukuran sampel. Populasi dan sampel bisa terbatas atau tak terbatas dan sama -sama mereka bisa ada atau hipotetis.
Perbedaan: Varians adalah nilai numerik yang menunjukkan seberapa luas angka individu dalam satu set data mendistribusikan diri tentang rata -rata. Itu adalah seberapa jauh setiap angka dari rata -rata, dan dengan demikian dari satu sama lain. Varian nilai nol berarti semua data identik. Lebih dari varian, lebih banyak nilai yang tersebar tentang rata -rata, karenanya satu sama lain. Lebih sedikit varians, lebih sedikit adalah nilai yang tersebar tentang rata -rata, karenanya dari satu sama lain, dan varian tidak bisa negatif.
Perbedaan antara varians populasi dan varian sampel
Perbedaan utama antara varian populasi dan varian sampel berkaitan dengan perhitungan varians. Varians dihitung dalam lima langkah. Rata -rata pertama dihitung, maka kami menghitung penyimpangan dari rata -rata, dan ketiga penyimpangan dikuadratkan, keempat penyimpangan kuadrat diringkas dan akhirnya jumlah ini dibagi dengan jumlah item yang variansnya dihitung. Dengan demikian varians = σ (xi-x-)/n. Dimana xi = ith. Angka, x- = rata-rata dan n = jumlah item…
Sekarang, ketika varians akan dihitung dari data populasi, N sama dengan jumlah item. Jadi jika varians dalam tekanan darah dari semua 1000 orang harus dihitung dari data tekanan darah dari semua 1000 orang, maka n = 1000. Namun ketika varians dihitung dari data sampel 1 harus dikurangkan dari n sebelum membagi jumlah penyimpangan kuadrat. Jadi dalam contoh di atas jika data sampel memiliki 100 item, penyebutnya adalah 100 - 1 = 99.
Karena ini, nilai varians yang dihitung dari data sampel lebih tinggi dari nilai yang dapat ditemukan dengan menggunakan data populasi. Logika melakukan itu adalah untuk mengkompensasi kurangnya informasi kami tentang data populasi. Tidak mungkin untuk mengetahui varian ketinggian dalam manusia, karena kurangnya informasi absolut tentang ketinggian semua manusia yang hidup, bukan untuk berbicara tentang masa depan. Bahkan jika kita mengambil satu contoh moderat, seperti data populasi tentang ketinggian semua pria yang hidup di dalam kita, secara fisik mungkin, tetapi biaya dan waktu yang terlibat dalam hal ini akan mengalahkan tujuan perhitungannya. Inilah alasan data sampel diambil untuk sebagian besar tujuan statistik, dan ini disertai dengan kurangnya informasi tentang sebagian besar data. Untuk mengkompensasi hal ini, nilai varians dan standar deviasi, yang merupakan akar varians kuadrat lebih tinggi dalam kasus data sampel daripada varian dari data populasi.
Ini bertindak sebagai perisai otomatis untuk para analis dan pembuat keputusan. Logikanya berlaku untuk keputusan penganggaran modal, keuangan pribadi dan bisnis, konstruksi, manajemen lalu lintas, dan banyak bidang yang berlaku. Ini membantu pemegang saham untuk berada di sisi yang aman saat mengambil keputusan atau untuk kesimpulan lainnya.
Ringkasan: Varians populasi mengacu pada nilai varians yang dihitung dari data populasi, dan varian sampel adalah varian yang dihitung dari data sampel. Karena nilai denominator ini dalam rumus untuk varian dalam hal data sampel adalah 'N-1', dan itu adalah 'n' untuk data populasi. Akibatnya varians dan standar deviasi yang berasal dari data sampel lebih dari yang ditemukan dari data populasi.