总体均数的估计与假设检验.ppt

上传人：清凉的夏天

文档编号：5819679

上传时间：2022-06-28

格式：PPT

页数：130

大小：1.49MB

《总体均数的估计与假设检验.ppt》由会员分享，可在线阅读，更多相关《总体均数的估计与假设检验.ppt（130页珍藏版）》请在文库网上搜索。

1、第三章总体均数的估计与假设检验Estimation of Population Mean and Hypothesis Test 1Content1. Sampling error and standard error of mean2. t- distribution3. Estimation of Population Mean4. t-test5. Notice of hypothesis test 6. Normality test and homogeneity of variance test2第一节均数的抽样误差与标准误3统计推断：由样本信息推断总体特征。样本统计指标（统计量

2、）总体统计指标（参数）正态（分布）总体：推断！说明！为说明抽样误差规律，先用一个实例，后引出理论。4图3-11999年某市18岁男生身高N(167.7,5.32)的抽样示意图 5见P3436表3-16将此100个样本均数看成新变量值，则这100个样本均数构成一新分布，绘制直方图。图3-2从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布7 ，各样本均数未必等于总体均数；各样本均数间存在差异；样本均数的分布为中间多，两边少，左右基本对称。样本均数的变异范围较之原变量的变异范围大大缩小。可算得这100个样本均数的均数为167.69cm、标准差为1.69cm。样本均数的抽样

3、分布具有如下特点：81、抽样误差：由个体变异产生的、抽样造成的样本统计量与总体参数的差别均数的抽样误差：由于抽样造成的样本均数与总体均数的差别原因：1）抽样 2）个体差异9本书以n=60为界限10表示样本统计量抽样误差大小的统计指标。均数标准误：说明均数抽样误差的大小，总体计算公式（3-1）2、标准误(standarderror,SE)实质：样本均数的标准差11数理统计证明： 12若用样本标准差S 来估计,（3-2）降低抽样误差的途径有：通过增加样本含量n；通过设计减少S。13第二节t 分布(t-distribution)14nt分布概述n抽样误差的分布规律nn样本总体nt分布理论n手段

4、（桥梁）目的15一、t 分布的概念1617式中为自由度(degreeoffreedom,df)3实际工作中，由于未知，用代替，则不再服从标准正态分布，而服从t 分布。18二、t 分布的图形与特征分布只有一个参数，即自由度19图3-3不同自由度下的t 分布图201特征： 212 t界值表：详见附表2，可反映t分布曲线下的面积。单侧概率或单尾概率：用表示；双侧概率或双尾概率：用表示。 22-tt023举例：24第三节总体均数的估计25一、参数估计用样本统计量推断总体参数。总体均数估计：用样本均数（和标准差）推断总体均数。2627按预先给定的概率(1)所确定的包含未知总体参数的一个范围。

5、总体均数的区间估计：按预先给定的概率(1)所确定的包含未知总体均数的一个范围。如给定=0.05,该范围称为参数的95%可信区间或置信区间；如给定=0.01,该范围称为参数的99%可信区间或置信区间。2区间估计(intervalestimation)：28二、总体均数可信区间的计算29n总体均数可信区间的计算n需考虑：n（1）总体标准差是否已知，n（2）样本含量n的大小n通常有两类方法：n（1）t分布法（2）u分布法30 1. 单一总体均数的可信区间3132P25,15号样本333435例3-3某地抽取正常成年人200名，测得其血清胆固醇的均数为3.64mmol/L，标准差为1.20mmo

6、l/L，估计该地正常成年人血清胆固醇均数的95%可信区间。36故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47,3.81)mmolL。37383940例3-4为了解氨甲喋呤(MTX)对外周血IL-2水平的影响，某医生将61名哮喘患者随机分为两组。其中对照组29例()，采用安慰剂；实验组32例()，采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10IU/ml()，标准差为7.02IU/ml()；试验组治疗前IL-2的均数为16.89IU/ml()，标准差为8.46IU/ml()。问两组治疗前基线的IL-2总体均数相差有多大？41第一步： 42能否下：两

7、组IL-2的总体均数“不同”或“有差别”的结论？43三、可信区间的确切涵义44n1.95%的可信区间的理解：n（1）所要估计的总体参数有95%的可能在我们所估计的可信区间内。n（2）从正态总体中随机抽取100个样本，可算得100个样本均数和标准差，也可算得100个均数的可信区间，平均约有95个可信区间包含了总体均数。n（3）但在实际工作中，只能根据一次试验结果估计可信区间，我们就认为该区间包含了总体均数。45n2.可信区间的两个要素n（1）准确度：用可信度（1）表示：即区间包含总体均数的理论概率大小。n当然它愈接近1愈好，如99%的可信区间比95%的可信区间要好。n（2）精确度：即区间的宽度n

8、区间愈窄愈好，如95%的可信区间比99%的可信区间要好。46n当n确定时，上述两者互相矛盾。n提高准确度（可信度），则精确度降低n（可信区间会变宽），势必降低可信区间的实际应用价值，故不能笼统认为99%可信区间比95%可信区间要好。n相反，在实际应用中，95%可信区间更为常用。47n在可信度确定的情况下，增加样本含量可减小区间宽度，提高精确度。48四、总体均数可信区间与参考值范围的区别49*也可用对应于双尾概率时), *也可用对应于双尾概率时)表3-2总体均数的可信区间与参考值范围的区别50第四节t 检验511、样本均数与已知某总体均数比较的t检验目的：推断一个未知总体均数与已知总体均

9、数是否有差别，用单样本设计。2、两个样本均数与比较的t检验目的：推断两个未知总体均数与是否有差别,用成组设计。3、配对设计资料均数比较的t检验目的：推断两个未知总体均数与是否有差别用配对设计。t 检验，亦称student t 检验,有下述情况:52对于大样本,也可以近似用u检验。53nt检验和u检验的应用条件:n1.t检验应用条件:n样本含量n较小时(如n60)n(1)正态分布n(2)方差齐性(homogeneityofvariance)n2.u检验应用条件:n样本含量n较大，或n虽小但总体标准差已知n(1)正态分布n(2)方差齐性(homogeneityofvariance

10、)54 假设检验过去称显著性检验。它是利用小概率反证法思想，从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量，最后获得P值来判断。假设检验基本思想及步骤55n例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量，算得其均数为130.83g/L，标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L？n130.83g/L140g/Ln原因：1.可能是总体均数不同n2.是抽样造成的5657H1的内容直接反映了检验单双侧。若H1中只是0或 0，则此检验为单侧检验。它不仅考虑有无差异，而且还考虑差异的方

11、向。单双侧检验的确定，首先根据专业知识，其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果，此时应该用单侧检验。一般认为双侧检验较保守和稳妥。58(3)检验水准，过去称显著性水准，是预先规定的概率值，它确定了小概率事件的标准。在实际工作中常取 = 0.05。可根据不同研究目的给予不同设置。59 根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等（如数据的分布类型）选择相应的检验统计量。2.计算检验统计量60 P的含义是指从H0规定的总体随机抽样，抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量(如t、u等)值的概率。例3-5的P值可用图

12、3-5说明，P为在=0=140g/L的前提条件下随机抽样，其t 小于及等于-2.138和大于及等于2.138的概率。 3.确定P值61图3-5例3-5中P值示意图6263若，是否也能下“无差别”或“相等”的结论？64一、单样本t检验(onesample/groupt-test)即样本均数（代表未知总体均数）与已知总体均数0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算65例3-5某医生测量了36名从事铅作业男性工人的血红蛋白含量，算得其均数为130.83g/L，标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L？(1)

13、建立检验假设，确定检验水准H0:=0=140g/L，即铅作业男性工人平均血红蛋白含量与正常成年男性平均值相等H1:0=140g/L，即铅作业男性工人平均血红蛋白含量与正常成年男性平均值不等 =0.0566(2)计算检验统计量 67(3)确定P值，作出推断结论 68配对t 检验适用于配对设计的计量资料。配对设计类型：两同质受试对象分别接受两种不同的处理；同一受试对象分别接受两种不同处理；同一受试对象(一种)处理前后。二、配对t 检验(paired/matchedt-test)69例3-6为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同，某人随机抽取了10份乳酸饮料制品，分别用脂肪酸水解法和哥特

14、里罗紫法测定其结果如表3-3第(1)(3)栏。问两法测定结果是否不同？70表3-3两种方法对乳酸饮料中脂肪含量的测定结果(%)71(1)建立检验假设，确定检验水准H0：d0，即两种方法的测定结果相同H1：d0，即两种方法的测定结果不同=0.05(2)计算检验统计量本例n=10，d=2.724，d2=0.8483， 72按公式(3-16)(3)确定P值，作出推断结论查附表2的t界值表得P0.001。按=0.05水准，拒绝H0，接受H1，有统计学意义。可认为两种方法对脂肪含量的测定结果不同，哥特里罗紫法测定结果较高。73 三、两样本t检验(two-sample/groupt-test)又称成组t

15、检验，适用于完全随机设计两样本均数的比较，此时人们关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同处理组。74适用范围：完全随机设计两样本均数的比较检验方法：依两总体方差是否齐性而定。7576例3-7为研究国产四类新药阿卡波糖胶囊的降血糖效果，某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊)，分别测得试验开始前和8周后的空腹血糖，算得空腹血糖下降值见表3-4，能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同？7778(2)计算检验统计量 79(3

16、)确定P值，作出推断结论80若变量变换后总体方差齐性可采用t 检验(如两样本几何均数的t 检验，就是将原始数据取对数后进行t 检验)；若变量变换后总体方差仍然不齐可采用t 检验或Wilcoxon秩和检验。若两总体方差不等（），？812.Cochran&Cox近似t 检验（t检验）调整 t 界值8283例3-8在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中，测得用拜唐苹胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人，其8周时糖化血红蛋白HbA1c(%)下降值如表3-5。问用两种不同药物的病人其HbA1c下降值是否不同？84表3-5对照组和试验组HbA1c下降值(%)对照

17、组方差是试验组方差的3.77倍，经方差齐性检验，认为两组的总体方差不等，故采用近似t 检验。85(1)建立检验假设，确定检验水准(略)(2)计算检验统计量 86(3)确定P值，作出推断结论。查t界值表t0.05/2,19=2.093。由t=0.9650.05。按=0.05水准，不拒绝H0，无统计学意义。还不能认为用两种不同药物的病人其HbA1c下降值不同。873.Satterthwaite近似t检验:Cochran&Cox法是对临界值校正而Satterthwaite法则是对自由度校正。88以=28.428、t=0.965查附表2的t界值表得0.20P0.40。结论同前。按Satterthwai

18、te法对例3-8做检验，得893.Welch法近似t检验Welch法也是对自由度进行校正。校正公式为90对例3-8，如按Welch法，则以=29.429、t =0.965查附表2的t界值表得0.20P60)，则可选用大样本u检验。99n3.正确理解“显著性”一词的含义差别有或无统计学意义，过去称差别有或无“显著性”，是对样本统计量与总体参数或样本统计量之间的比较而言，相应推断为：可以认为或还不能认为两个或多个总体参数有差别。100n4.结论不能绝对化因统计结论具有概率性质，故“肯定”、“一定”、“必定”等词不要使用。在报告结论时，最好列出检验统计量的值，尽量写出具体的P值或P值的确切范围，如

19、写成P=0.040或0.02P0.05，而不简单写成P0.05，以便读者与同类研究进行比较或进行循证医学时采用Meta分析。101n5.假设检验是为专业服务的，统计结论必须和专业结论有机地相结合，才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致，则最终结论就和这两者均一致(即均有或均无意义)；若统计结论和专业结论不一致，则最终结论需根据实际情况加以考虑。若统计结论有意义，而专业结论无意义，则可能由于样本含量过大或设计存在问题，那么最终结论就没有意义。1026.可信区间与假设检验各自不同的作用，要结合使用。一方面，可信区间亦可回答假设检验的问题，算得的可信区间若包含了H0，则

20、按水准，不拒绝H0；若不包含H0，则按水准，拒绝H0，接受H1。103 另一方面，可信区间不但能回答差别有无统计学意义，而且还能比假设检验提供更多的信息，即提示差别有无实际的专业意义。104图3-7可信区间在统计推断上提供的信息105 虽然可信区间亦可回答假设检验的问题，并能提供更多的信息，但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率检验水准的前提下进行计算，而假设检验能够获得一较为确切的概率P值。106第六节正态性检验和两样本方差比较的F检验107 t 检验的应用条件是正态总体且方差齐性；配对t 检验则要求每对数据差值的总体为正态总体。进行两小样本t检验时，一般应对

21、资料进行方差齐性检验，尤其两样本方差悬殊时。若方差齐，采用一般的t 检验；若方差不齐，则采用t检验。108一、正态性检验(normalitytest)1图示法：P-Pplot，Q-Qplot2矩法偏度系数(skewness)，峰度系数(kurtosis)。3 W 检验法4 D 检验法109图3-8例3-1中100个样本均数的P-P图110图3-9例3-1中100个样本均数的Q-Q图111112113例3-9 试用矩法对表3-1中计算机模拟抽样所得100个样本均数进行正态性检验。114 (2)计算检验统计量115二、两样本方差比较的F检验两小样本t检验时，检查两样本方差代表的总体方差是否相等（决

22、定t 检验的方法）。1.Levene检验2.F检验116117118图3-10不同自由度时F分布的图形119(2)计算检验统计量例3-10对例3-7，用F 检验判断两总体空腹血糖下降值的方差是否不等。(1)建立检验假设，确定检验水准120(3)确定P值，作出推断结论121三、变量变换常用的变量变换有对数变换、平方根变换、倒数变换、平方根反正弦变换等，应根据资料性质选择适当的变量变换方法。 122123124125小结1.均数的标准误与标准差的区别1262.两均数差别检验的比较：大样本也可近似用u检验1273.假设检验的步骤及有关概念（1）基本思想：“小概率事件在一次抽样试验中几乎是不可能发生”的原理。（2）步骤：三部曲（3）类错误、类错误（4）检验效能（1-）128练习题一最佳选则题全做三计算分析题，129130