可信区间是按一定的概率估计总体参数所在的范围,下面为你详细介绍不同情况下可信区间的计算方法。
对于总体均数的可信区间计算,根据总体标准差是否已知以及样本量的大小,分为以下几种情况。
当总体标准差已知时,无论样本量大小,总体均数的可信区间可根据正态分布原理来计算。对于双侧可信区间,计算公式为样本均数±Zα/2×(总体标准差/根号下样本量)。这里的Zα/2是标准正态分布的界值,比如求95%可信区间时,α = 0.05,Zα/2 = 1.96;求99%可信区间时,α = 0.01,Zα/2 = 2.58 。以一个例子来说明,已知某总体标准差为5,从该总体中抽取样本量为100的样本,样本均数为50,求95%可信区间,代入公式可得50 ± 1.96×(5/根号100),即(49.02,50.98)。
当总体标准差未知,但样本量足够大(一般认为n≥50)时,可用样本标准差S代替总体标准差,此时总体均数的双侧可信区间计算公式为样本均数±Zα/2×(样本标准差/根号下样本量)。这是因为当样本量足够大时,样本标准差能较好地估计总体标准差,且样本均数近似服从正态分布。
当总体标准差未知且样本量较小时(n < 50),样本均数服从自由度为n - 1的t分布,总体均数的双侧可信区间计算公式为样本均数±tα/2,ν×(样本标准差/根号下样本量),其中tα/2,ν是自由度为ν(ν = n - 1)的t分布的界值,可通过查阅t界值表得到。例如,从某总体抽取样本量为20的样本,样本均数为30,样本标准差为4,求95%可信区间,自由度ν = 20 - 1 = 19,查t界值表得t0.05/2,19 = 2.093,代入公式可得30 ±
对于总体均数的可信区间计算,根据总体标准差是否已知以及样本量的大小,分为以下几种情况。
当总体标准差已知时,无论样本量大小,总体均数的可信区间可根据正态分布原理来计算。对于双侧可信区间,计算公式为样本均数±Zα/2×(总体标准差/根号下样本量)。这里的Zα/2是标准正态分布的界值,比如求95%可信区间时,α = 0.05,Zα/2 = 1.96;求99%可信区间时,α = 0.01,Zα/2 = 2.58 。以一个例子来说明,已知某总体标准差为5,从该总体中抽取样本量为100的样本,样本均数为50,求95%可信区间,代入公式可得50 ± 1.96×(5/根号100),即(49.02,50.98)。
当总体标准差未知,但样本量足够大(一般认为n≥50)时,可用样本标准差S代替总体标准差,此时总体均数的双侧可信区间计算公式为样本均数±Zα/2×(样本标准差/根号下样本量)。这是因为当样本量足够大时,样本标准差能较好地估计总体标准差,且样本均数近似服从正态分布。
当总体标准差未知且样本量较小时(n < 50),样本均数服从自由度为n - 1的t分布,总体均数的双侧可信区间计算公式为样本均数±tα/2,ν×(样本标准差/根号下样本量),其中tα/2,ν是自由度为ν(ν = n - 1)的t分布的界值,可通过查阅t界值表得到。例如,从某总体抽取样本量为20的样本,样本均数为30,样本标准差为4,求95%可信区间,自由度ν = 20 - 1 = 19,查t界值表得t0.05/2,19 = 2.093,代入公式可得30 ±

学员讨论(0)
相关资讯












扫一扫立即下载


