样本方差公式是怎样推导出来的呢?
日期:2023-4-80 次浏览
你可能很快就会意识到,在上面的陈述中似乎有一些不明确的地方。例如,在“样本方差公式”中,最引人注目的是,该公式中的“平均值”不是简单地去除样本量,而是去除从样本量中减去1的奇怪数字。这实际上是解决这个问题的关键。为什么
的情况如此奇怪?如果我只想使用n的数据量,会有什么后果?有必要仔细研究一下相关的推导。请注意以下推导(引自维基百科):在这个推导中,我们直接除以N。然而,在推导之后,我们会发现我们可以得到正确的方差,除非估计的x平均值完全等于统计估计中的实际平均值。否则,如果我们除以N,得到的方差总是比实际方差小一点,这个小差异就是“偏差”。使用n-1意味着我们所做的是“无偏估计”。
也有更直观的理解,因为我们在计算方差时使用平均值,一旦我们有了平均值,原始数据的N个数就不再是独立的。例如,我知道这两个数字的平均值是60,然后我知道其中一个数字是58,另一个是62。如果有N个原始数据,且计算期间已知平均值(估计值),则只有N-1个独立数据,因此应使用N-1。