(06)第6章假设检验(2011年).ppt
《(06)第6章假设检验(2011年).ppt》由会员分享,可在线阅读,更多相关《(06)第6章假设检验(2011年).ppt(119页珍藏版)》请在文库网上搜索。
1、数据分析(方法与案例)作者 贾俊平统计学统 计 学6 - 2统计学STATISTICS(第四版) 正如一个法庭宣告某一判决为“无罪(not guilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。 Jan Kmenta统计名言统计名言第 6 章 假设检验6.1 假设检验的基本原理 6.2 一个总体参数的检验6.3 两个总体参数的检验6 - 4统计学STATISTICS(第四版)学习目标l假设检验的基本思想和原理 l假设检验的步骤l一个总体参数的检验l两个总体参数的检验lP值的计算与应用l用Excel进行检验6 - 5统计学STATISTICS(第四版)
2、正常人的平均体温是37oC吗? 当问起健康的成年人体温是多少时,多数人的回答是37oC,这似乎已经成了一种共识。下面是一个研究人员测量的50个健康成年人的体温数据 37.136.936.937.136.436.936.636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.06 - 6统计学STATISTICS
3、(第四版)正常人的平均体温是37oC吗? 根据样本数据计算的平均值是36.8oC ,标准差为0.36oC 根据参数估计方法得到的健康成年人平均体温的95%的置信区间为(36.7,36.9)。研究人员发现这个区间内并没有包括37oC 因此提出“不应该再把37oC作为正常人体温的一个有任何特定意义的概念” 我们应该放弃“正常人的平均体温是37oC”这个共识吗?本章的内容就将提供一套标准统计程序来检验这样的观点6.1 6.1 假设检验的基本原理假设检验的基本原理 6.1.1 6.1.1 怎样提出假设?怎样提出假设? 6.1.2 6.1.2 怎样做出决策?怎样做出决策? 6.1.3 6.1.3 怎样表
4、述决策结果?怎样表述决策结果?第 6 章 假设检验6.1.1 怎样提出假设?6.1 6.1 假设检验的基本原理假设检验的基本原理6 - 9统计学STATISTICS(第四版)什么是假设?(hypothesis)在参数检验中,对总体参数的具体数值所作的陈述n就一个总体而言,总体参数包括总体均值、比例、方差等n分析之前必需陈述我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效! !6 - 10统计学STATISTICS(第四版)什么是假设检验? (hypothesis test) 先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法 有参数
5、检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理n小概率是在一次试验中,一个几乎不可能发生的事件发生的概率n在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设6 - 11统计学STATISTICS(第四版)原假设(null hypothesis) 又称“0假设”,研究者想收集证据予以反对的假设,用H0表示 所表达的含义总是指参数没有变化或变量之间没有关系 最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 总是有符号 , 或nH0 : = 某一数值nH0 : 某一数值nH0 : 某一数值l例如, H0 : 10cm6 - 12统计学STATISTICS(第四版) 也称“
6、研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示 所表达的含义是总体参数发生了变化或变量之间有某种关系 备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 总是有符号 , 或 nH1 : 某一数值nH1 : 某一数值nH1 : ”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)n备择假设的方向为“”,称为右侧检验 双侧检验与单侧检验双侧检验与单侧检验6 - 14统计学STATISTICS(第四版)双侧检验与单侧检验 (假设的形式)假双左右原假H0 : m =m0H0 : m m0H0 : m m0 假H1 :
7、m m0H1 : m m0以总体均值的检验为例以总体均值的检验为例6 - 15统计学STATISTICS(第四版)【例6-1】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设提出假设( (例题分析例题分析) )解:解:研究者想收集证据予以证明的假设应该是研究者想收集证据予以证明的假设应该是“生产过程不正常生产过程不正常”。建立的原假设和备择假。建立的原假设和备择假设为设为 H H
8、0 0 : 10cm 10cm H H1 1 : 10cm10cm 6 - 16统计学STATISTICS(第四版)【例6-2】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设提出假设( (例题分析例题分析) )解:解:研究者抽检的意图是倾向于证研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符实这种洗涤剂的平均净含量并不符合说明书中的陈述合说明书中的陈述 。建立的原假设。建立的原假设和备择假设为和备择假设为 H H0 0 : 500 500 H
9、 H1 1 : 500500500g500g绿叶绿叶洗涤剂洗涤剂6 - 17统计学STATISTICS(第四版)【例6-3】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设提出假设( (例题分析例题分析) )解:解:研究者想收集证据予以支持的假研究者想收集证据予以支持的假设是设是“ “该城市中家庭拥有汽车的比例超该城市中家庭拥有汽车的比例超过过30%30%” ”。建立的原假设和备择假设为。建立的原假设和备择假设为 H H0 0 : 30% 30% H H1 1 : 30%30%6 -
10、18统计学STATISTICS(第四版) 原假设和备择假设是一个完备事件组,而且相互对立n在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设提出假设( (结论与建议结论与建议) )6.1.2 怎样做出决策?6.1 6.1 假设检验的基本原理假设检验的基本原理6 - 20统计学STATISTICS(第四版)两类错误与显著性水平 研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误 原假设和备择假
11、设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误 第类错误(错误)n原假设为正确时拒绝原假设n第类错误的概率记为,被称为显著性水平2. 第类错误(错误)n原假设为错误时未拒绝原假设n第类错误的概率记为(Beta)6 - 21统计学STATISTICS(第四版)两类错误的控制 一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些 一般来说,发生哪一类错误的后
12、果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率6 - 22统计学STATISTICS(第四版)显著性水平 (significant level) 事先确定的用于拒绝原假设H0时所必须的证据 能够容忍的犯第类错误的最大概率(上限值)2.原假设为真时,拒绝原假设的概率n 抽样分布的拒绝域3.表示为 (alpha)n 常用的 值有0.01, 0.05, 0.104.由研究者事先确定6 - 23统计学STATISTICS(第四版)依据什么做出决策? 若假设为H0:=500,H1: 临界值,拒绝H0n左侧检验:
13、统计量 临界值,拒绝H06 - 29统计学STATISTICS(第四版)用P 值决策 (P-value) 如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设 被称为观察到的(或实测的)显著性水平 决策规则:若p值, 拒绝 H06 - 30统计学STATISTICS(第四版)双侧检验的P 值 / / 2 2 / / 2 2 Z Z拒绝拒绝H H0 0拒绝拒绝H H0 00 0临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界
14、值临界值1/2 1/2 P P 值值1/2 1/2 P P 值值6 - 31统计学STATISTICS(第四版)左侧检验的P 值Z Z拒绝拒绝H H0 00 0临界值临界值计算出的样本统计量计算出的样本统计量P P 值值6 - 32统计学STATISTICS(第四版)右侧检验的P 值Z Z拒绝拒绝H H0 00 0计算出的样本统计量计算出的样本统计量临界值临界值P P 值值6 - 33统计学STATISTICS(第四版)P P值是关于数据的概率值是关于数据的概率 P值原假设的对或错的概率无关 它反映的是在某个总体的许多样本中某一类数据出现的经常程度,它是当原假设正确时,得到目前这个样本数据的概
15、率n比如,要检验全校学生的平均生活费支出是否等于500元,检验的假设为H0:=500;H0:500 。假定抽出一个样本算出的样本均值600元,得到的值为P=0.02,这个0.02是指如果平均生活费支出真的是500元的话,那么,从该总体中抽出一个均值为600的样本的概率仅为0.02。如果你认为这个概率太小了,就可以拒绝原假设,因为如果原假设正确的话,几乎不可能抓到这样的一个样本,既然抓到了,就表明这样的样本不在少数,所以原假设是不对的 值越小,你拒绝原假设的理由就越充分6 - 34统计学STATISTICS(第四版) 要证明原假设不正确,P值要多小,才能令人信服呢?n原假设的可信度又多高?如果H
16、0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们n拒绝的结论是什么?如果拒绝H0而肯定H1 ,你就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)多大的多大的P P 值合适值合适? ?6 - 35统计学STATISTICS(第四版) 有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设n只要你认为这么大的P值就算是显著了,你就可以在
17、这样的P值水平上拒绝原假设 传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设固定显著性水平是否有意义固定显著性水平是否有意义6 - 36统计学STATISTICS(第四版) 用P值进行检验比根据统计量检验提供更多的信息 统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少n比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,
18、统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少P P 值决策与统计量的比较值决策与统计量的比较6 - 37统计学STATISTICS(第四版)拒绝拒绝H H0 0P 值决策与统计量的比较拒绝拒绝H H0 0的两个统计量的不同显著性的两个统计量的不同显著性Z Z拒绝拒绝H H0 00 0统计量统计量1 1 P P1 1 值值统计量统计量2 2 P P2 2 值值拒绝拒绝H H0 0临界值临界值6.1.3 怎样表述决策结果?6.1 6.1 假设检验的基本
19、原理假设检验的基本原理6 - 39统计学STATISTICS(第四版)假设检验不能证明原假设正确 假设检验的目的主要是收集证据拒绝原假设,而支持你所倾向的备择假设 假设检验只提供不利于原假设的证据。因此,当拒绝原假设时,表明样本提供的证据证明它是错误的,当没有拒绝原假设时,我们也没法证明它是正确的,因为假设检验的程序没有提供它正确的证据n这与法庭上对被告的定罪类似:先假定被告是无罪的,直到你有足够的证据证明他是有罪的,否则法庭就不能认定被告有罪。当证据不足时,法庭的裁决是“被告无罪”,但这里也没有证明被告就是清白的6 - 40统计学STATISTICS(第四版)假设检验不能证明原假设正确 假设
20、检验得出的结论都是根据原假设进行阐述的n我们要么拒绝原假设,要么不拒绝原假设 当不能拒绝原假设时,我们也从来不说“接受原假设”,因为没有证明原假设是真的n采用“接受”原假设的说法,则意味着你证明了原假设是正确的 没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的,它仅仅意为着目前还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设n比如,在例6.2中,如果拒绝原假设,表明样本提供的证据证明该品牌洗涤剂的净含量与说明书所标识的不相符。如果不拒绝原假设,只能说这个样本提供的证据还不足证明净含量不是500克或500克以上,并不等于证明了净含量就超过了500克 “不拒
21、绝”的表述方式实际上意味着没有得出明确的结论6 - 41统计学STATISTICS(第四版)假设检验不能证明原假设正确 “接受”的说法有时会产生误导n这种说法似乎暗示着原假设已经被证明是正确的了n实事上,H0的真实值我们永远也无法知道,不知道真实值是什么,又怎么能证明它是什么?nH0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确 采用“不拒绝”的表述方法更合理一些,因为这种表述意味着样本提供的证据不够强大,因而没有足够的理由拒绝,这不等于已经证明原假设正确 6 - 42统计学STATISTICS(第四版)假设检验不能证明原假设正确【例】比如原假设为H0:=10,从该总
22、体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意为着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?6 - 43统计学STATISTICS(第四版)假设检验不能证明原假设正确 假设检验中通常是先确定显著性水平,这就等于控制了第类错误的概率,但犯第类错误的概率却是不确定的 在拒绝H0时,犯第类错误的概率不超过给定的显著性水平,当样本结果显示没有充分理由拒绝原假设时,也难以确切
23、知道第类错误发生的概率 采用“不拒绝”而不采用“接受”的表述方式,在多数场合下便避免了错误发生的风险n因为“接受”所得结论可靠性将由第类错误的概率来测量,而的控制又相对复杂,有时甚至根本无法知道的值,除非你能确切给出 ,否则就不宜表述成“接受”原假设6 - 44统计学STATISTICS(第四版)假设检验不能证明原假设正确 在实际检验中,针对一个具体的问题,将检验结果表述为“不拒绝”原假设,这似乎让人感到无所是从n比如,你想购买一批产品,检验的结果没有拒绝原假设,即达到合同规定的标准要求,你是否购买这批产品呢?这时,你可以对检验的结果采取某种默认态度,退一步说,你可以将检验结果表述为“可以接受
24、”原假设,你但这并不等于说你“确实接受”它6 - 45统计学STATISTICS(第四版)统计上显著不一定有实际意义 当拒绝原假设时,我们称样本结果是统计上显著的(statistically Significant) 当不拒绝原假设时,我们称样本结果是统计上不显著的 在“显著”和“不显著”之间没有清除的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著6 - 46统计学STATISTICS(第四版) “显著的”(Significant)一词的意义在这里并不是“重要的”,而是指“非偶然的”一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,
25、不是靠机遇能够得到的如果得到这样的样本概率(P)很小,则拒绝原假设n在这么小的概率下竟然得到了这样的一个样本,表明这样的样本经常出现,所以,样本结果是显著的统计上显著不一定有实际意义6 - 47统计学STATISTICS(第四版)统计上显著不一定有实际意义 在进行决策时,我们只能说P值越小,拒绝原假设的证据就越强,检验的结果也就越显著 但P值很小而拒绝原假设时,并不一定意味着检验的结果就有实际意义n因为假设检验中所说的“显著”仅仅是“统计意义上的显著”n一个在统计上显著的结论在实际中却不见得就很重要,也不意味着就有实际意义 因为值与样本的大小密切相关,样本量越大,检验统计量的P值也就越大,P值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 06 假设检验 2011