4.2枢轴量法(续)
下面这个例子是求单侧情形的:
例某产品寿命
服从指数分布,密度函数为
从中抽取简单随机样本
,求平均寿命 的单侧置信下限.
解步骤还是三步
第一步,从充分统计量或点估计出发找枢轴量。
对于指数分布总体,充分统计量为
,由于指数分布是gamma分布,结合gamma分布的可加性得到 ,再利用gamma分布关于尺度参数的伸缩性,得到
它包含了代估参数且分布完全已知,所以是合适的枢轴量.
第二步,确定常数。
因为是单侧情形,所以我们只需要确定一个常数。但是应该确定
还是 呢?这里需要从最终想要得到的区间形式出发, 由于求的是置信下限,所以区间形式为 大于某个数,而在枢轴量中 在分母上,所以应该是枢轴量小于某个数,也就是寻找 .
常数
可以用卡方分布的分位数表示,即
第三步,等价改写得区间估计。
将上述概率中不等式改写,得到
因此所求的同等置信下限为
.
这里为什么要配凑系数使得枢轴量是卡方分布呢?因为卡方分布的分位数有表可查!
4.2.2正态总体参数的置信区间
关于正态总体的参数估计是应用中遇见最多的,这里分单一正态总体和两个正态总体;其中单一正态总体分为4种情形。
※单一正态总体
均值的置信区间:已知
第一步寻找枢轴量。
总体均值的充分统计量为
,将这个正态分布标准化得到
其中包含代估参数,分布完全已知,可以作为枢轴量.
第二步确定常数。(以双侧同等置信区间为例)
即确定常数
满足
采用等尾取法,
,由于分布是对称的,所以此时平均区间长度也是最短的.
第三步等价改写,得置信区间。
将概率中的不等式改写,得
因此置信水平为
的双侧置信区间为 .
考察下这时的区间长度,为
确定,可以通过增大样本容量 来减小区间长度. 确定, 越大,则区间长度越大. 确定, 越小,置信水平越高,此时区间长度也越大,即精确度越低.未知
第一步选取枢轴量.
能不能借鉴
已知的枢轴量 ?
不能!因为当
未知时,这个形式中含有非代估参数的未知参数 !
不过我们很自然想到,可以用
的点估计量 来替代它,而抽样分布中的定理告诉我们
它的分布完全已知,因此这是合适的枢轴量.
第二第三步完全类似,最后求出的双侧置信区间为
比较它和
已知情形下的区间估计,就是将标准正态分位数改为自由度为 的t分布的分位数,且 变为 .
在上一讲已经给出了求平均区间长度的方法(将
配成卡方然后用随机变量函数期望公式)
即
下面以一个具体例子说明有关正态总体参数区间估计的题目具体步骤:
例设某种植物高度
服从正态分布 ,随机选取36棵,平均高度为15,在两种情形下求 的置信水平为95%的双侧置信区间.未知,
解题步骤:
列数值,明确估计问题.取枢轴量,带分布.常数 纸上写出(这一步易错),卷上直接带值,写置信水平条件.(这一步可省)纸上改写不等式,卷上直接写区间.写出分位数取值,代入得具体区间.
已知
,估计 --列数值,明确问题
此时取
为枢轴量--取枢轴量,带分布
那么
--用分位数表示常数,写置信水平条件
得
的置信水平为 的置信区间为 --写区间
查表得
,代入数值得到 的置信水平为 的置信区间为 --写出分位数取值,代入得具体区间.
已知
,现 未知,估计 --列数值,明确问题
此时取
为枢轴量--取枢轴量,带分布
那么
--用分位数表示常数,写置信水平条件
得
的置信水平为 的置信区间为
--写区间
查表得
,代入数值得到 的置信水平为 的置信区间为 --写出分位数取值,代入得具体区间.
比较发现,在精确度方面第二种情形的区间长度更长,精确度差一些,但是由于一般情况都是
未知的情形,所以第二种情形更实用!方差的置信区间未知
关于方差的区间估计,从它的点估计量
出发,而 又与卡方分布有关,因此配凑得
这只包含代估参数
而没有未知参数 ,且分布完全已知,因此是合理的枢轴量.
后面第二第三步简写了
同等置信区间为
其中
,注意的是因为卡方分布不是对称的,所以等尾取法并不能使平均区间长度最短!
因为
是非负的,所以如果要求标准差 的置信区间,直接由上面的开根号即可.已知
你可能会发现,如果此时我们仍用
作为枢轴量,其实也是可以的,但是这样就没有充分利用已知的信息,会导致精度下降.
这时如果写出联合密度,就能得到充分统计量为
,从它出发得到
这就是
已知时合理的枢轴量.
第二第三步简写:
同等置信区间为
同样,如果是求标准差
的区间估计,对这个区间的上下限开根号即可.
例为测得某种溶液中的甲醛浓度,取样测得4个独立测定值的平均值
,
样本标准差
,并设测量值近似服从正态分布,求总体方差 和标准
差
的置信水平为 的置信区间.
解解题步骤一样分为5步.
已知
, 未知,估计 --列数值,明确问题
此时取
为枢轴量--取枢轴量,带分布
那么
--用分位数表示常数,写置信水平条件(可省)
得
的置信水平为 的同等置信区间为
--写区间
查表得
,代入数值得到 的置信水平为 的同等置信区间为 --写出分位数取值,代入得具体区间.
而上下限同时开根号就得到标准差的区间估计为
.的置信域
这是个二维问题,但是不怕,还是三步。
第一步从充分统计量出发构造枢轴量.
已经证明过
是 的充分统计量,并且有
而且
是独立的,所以上述两个量也是独立的,而每个量的分布都是已知的,所以联合后分布也是完全已知的,因此取枢轴量为 .
第二步确定常数.
二维情形一般取长方形区域
,则概率为
根据独立性,概率等于
这时我们平均分配概率,即这两个概率都是
,即
类似前面用分位数表示常数,得
第三步,等价改写概率中不等式.
根据独立性有
因此置信域为
之所以保留
的形式,是因为从中不好转化成 .
如果觉得《单个正态总体均值的区间估计_数理统计第20讲(单一正态总体区间估计)》对你有帮助,请点赞、收藏,并留下你的观点哦!