总体均数的估计与假设检验.ppt
《总体均数的估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《总体均数的估计与假设检验.ppt(130页珍藏版)》请在文库网上搜索。
1、第三章 总体均数的估计与假设检验Estimation of Population Mean and Hypothesis Test 1Content1. Sampling error and standard error of mean2. t- distribution3. Estimation of Population Mean4. t-test5. Notice of hypothesis test 6. Normality test and homogeneity of variance test2第一节 均数的抽样误差与标准误3统计推断:由样本信息推断总体特征。样本统计指标(统计量
2、)总体统计指标(参数)正态(分布)总体: 推断 ! 说明!为说明抽样误差规律,先用一个实例,后引出理论。4图3-11999年某市18岁男生身高N(167.7,5.32)的抽样示意图 5见P3436表3-16将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。图3-2从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布7 ,各样本均数未必等于总体均数; 各样本均数间存在差异; 样本均数的分布为中间多,两边少,左右基本对称。 样本均数的变异范围较之原变量的变异范围大大缩小。可算得这100个样本均数的均数为167.69cm、标准差为1.69cm。样本均数的抽样
3、分布具有如下特点:81、抽样误差: 由个体变异产生的、抽样造成的样本统计量与总体参数的差别 均数的抽样误差:由于抽样造成的样本均数与总体均数的差别 原因:1)抽样 2)个体差异9本书以n=60为界限10表示样本统计量抽样误差大小的统计指标。均数标准误:说明均数抽样误差的大小,总体计算公式(3-1)2、标准误(standarderror,SE)实质:样本均数的标准差11数理统计证明: 12若用样本标准差S 来估计,(3-2)降低抽样误差的途径有:通过增加样本含量n;通过设计减少S。13第二节t 分布(t-distribution)14nt分布概述n抽样误差的分布规律nn样本总体nt分布理论n手段
4、(桥梁)目的15一、t 分布的概念1617式中为自由度(degreeoffreedom,df)3实际工作中,由于 未知,用 代替,则 不再服从标准正态分布,而服从t 分布。18二、t 分布的图形与特征 分布只有一个参数,即自由度19图3-3不同自由度下的t 分布图201特征: 212 t界值表:详见附表2,可反映t分布曲线下的面积。单侧概率或单尾概率:用表示;双侧概率或双尾概率:用表示。 22-tt023举例:24第三节 总体均数的估计25一、参数估计 用样本统计量推断总体参数。总体均数估计:用样本均数(和标准差)推断总体均数。2627按预先给定的概率(1)所确定的包含未知总体参数的一个范围。
5、总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。 如给定=0.05,该范围称为参数的95%可信区间或置信区间; 如给定=0.01,该范围称为参数的99%可信区间或置信区间。2区间估计(intervalestimation):28二、总体均数可信区间的计算29n总体均数可信区间的计算n需考虑:n(1)总体标准差是否已知,n(2)样本含量n的大小n通常有两类方法:n(1)t分布法 (2)u分布法30 1. 单一总体均数的可信区间3132P25,15号样本333435例3-3某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmo
6、l/L,估计该地正常成年人血清胆固醇均数的95%可信区间。36故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47,3.81)mmolL。37383940例3-4为了解氨甲喋呤(MTX)对外周血IL-2水平的影响,某医生将61名哮喘患者随机分为两组。其中对照组29例(),采用安慰剂;实验组32例(),采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10IU/ml(),标准差为7.02IU/ml();试验组治疗前IL-2的均数为16.89IU/ml(),标准差为8.46IU/ml()。问两组治疗前基线的IL-2总体均数相差有多大?41第一步: 42能否下:两
7、组IL-2的总体均数“不同”或“有差别”的结论?43三、可信区间的确切涵义44n1.95%的可信区间的理解:n(1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。n(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数。n(3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数。45n2.可信区间的两个要素n(1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小。n当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好。n(2)精确度:即区间的宽度n
8、区间愈窄愈好,如95%的可信区间比99%的可信区间要好。46n当n确定时,上述两者互相矛盾。n提高准确度(可信度),则精确度降低n(可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好。n相反,在实际应用中,95%可信区间更为常用。47n在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。48四、总体均数可信区间与参考值范围的区别49*也可用对应于双尾概率时), *也可用对应于双尾概率时)表3-2总体均数的可信区间与参考值范围的区别50第四节t 检验511、样本均数 与已知某总体均数 比较的t检验 目的:推断一个未知总体均数 与已知总体均
9、 数 是否有差别,用单样本设计。2、两个样本均数 与 比较的t检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。3、配对设计资料均数比较的t检验目的:推断两个未知总体均数 与 是否有差别用配对设计。t 检验,亦称student t 检验,有下述情况:52对于大样本,也可以近似用u检验。53nt检验和u检验的应用条件:n1.t检验应用条件:n样本含量n较小时(如n60)n(1)正态分布n(2)方差齐性(homogeneityofvariance)n2.u检验应用条件:n样本含量n较大,或n虽小但总体标准差已知n(1)正态分布n(2)方差齐性(homogeneityofvariance
10、)54 假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。 假设检验基本思想及步骤55n例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?n130.83g/L140g/Ln原因:1.可能是总体均数不同n2.是抽样造成的5657H1的内容直接反映了检验单双侧。若H1中只是0或 0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方
11、向。单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。58(3)检验水准,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取 = 0.05。可根据不同研究目的给予不同设置。59 根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。2.计算检验统计量60 P的含义是指从H0规定的总体随机抽样,抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量(如t、u等)值的概率。例3-5的P值可用图
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 总体 估计 假设检验