文库网
ImageVerifierCode 换一换
首页 文库网 > 资源分类 > PPT文档下载
分享到微信 分享到微博 分享到QQ空间

回归分析陆.ppt

  • 资源ID:9043073       资源大小:1.93MB        全文页数:108页
  • 资源格式: PPT        下载积分:40文币
微信登录下载
快捷下载 游客一键下载
账号登录下载
三方登录下载: QQ登录 微博登录
二维码
扫码关注公众号登录
下载资源需要40文币
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

回归分析陆.ppt

1、Linear regression线性回归易洪刚Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University两指标间的关系分析1 直线相关分析 (Linear Correlation Analysis) 直线回归分析 (Linear Regression Analysis) 总结 (Summary)CONTENTS2直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设

2、检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解3引言 对于2岁时的身高和成年后身高间的关系,相关关系; 即便具有相同的2岁身高,成年后的身高也不一定相同; 2岁身高X与成年后身高Y的散点图Y 成年后的身高(英寸)X 两岁时的身高(英寸)30323436384063656769714引言 对于女大学生的体重和肺活量间的关系 即便具有相同的体重,肺活量也不一定相同;Y 肺活量(L)X 体重(kg)40602.04.03.02.53.5504555女大学生体重(X)

3、与肺活量(Y)的散点图5折衷的解释 虽然它们之间有数量关系,但并非确定性的数量关系。 是一种宏观的关系!6直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解7 回答“变量之间是什么数量关系?”; 宏观上来讲,他们呈直线关系,但并不能用来描述。所以我们用回归方程:“hat”表示估计值,给定x时y的条件均数。2 直线

4、回归方程的建立82 直线回归方程的建立 Y 因变量 (dependent variable, response variable) X 自变量 (independent variable, explanatory variable) 直线回归的形式:9不同斜率时回归直线的表现XY10Regression Regression 释意释意112 直线回归方程的建立 最小二乘法(least square estimation)12例 某地10名三岁儿童体重与体表面积 X Y (体重,kg) (体表面积,103cm2 )11.0 5.28311.8 5.29912.0 5.35812.3 5.2921

5、3.15.60213.7 6.01414.4 5.83014.9 6.10215.2 6.07516.0 6.4111310名3岁男童体重与体表面积散点图1112131415165.05.56.06.5体重(kg),X体表面积Y(103cm2)14体重与体表面积的回归15回归直线的绘制 计算不太接近的两点的Y值: X=12kg时 Yhat=2.5212+0.238512=5.3832(103cm2) X=15kg时 Yhat=2.5212+0.238515=6.0987(103cm2)1610名3岁男童体重与体表面积回归图1112131415165.05.56.06.5体重(kg),X体表面积

6、Y(103cm2)17直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解183 回归系数和回归方程的意义及性质b 的意义a 的意义 的意义 的意义 的意义19b 的意义 斜率(slope) 体重与体表面积的关系 2.5212 + 0.2385 X 体重每增加 1 kg, 则体表面积平均增加 0.2385(103c

7、m2)nb 的单位为 (Y的单位/X的单位)20a 的意义 a 截距(intercept, constant) X=0 时,Y的估计值 A的单位与Y值相同 当X可能取0时,a才有实际意义。21估计值 的意义 X=11时, =5.145, 即体重为 11 kg 的三岁男童, 其平均体表面积之估计为 5.145 (103cm2);X=15时, =6.099, 即体重为 15 kg 的三岁男童, 其平均体表面积之估计为 6.099 (103cm2). 给定X时,Y的估计值。 当 时,22由体重(kg)估计体表面积(103cm2 ) X Y Y 的估计值 (体重,kg) (体表面积)11.0 5.28

8、35.14511.8 5.2995.33612.0 5.3585.38312.3 5.2925.45513.1 5.6025.64613.76.0145.78914.4 5.8305.95614.9 6.1026.07515.2 6.0756.14616.0 6.4116.33723Y 体重增量(g)X 进食量(g)6007008009001000110120130140150160170180190 的意义 为残差(residual) :点到直线的纵向距离24 残差平方和 (residual sum of squares). 综合表示点距直线的距离。 在所有的直线中,回归直线的残差平方和是最

9、小的。(最小二乘) 的意义25点到直线的距离1112131415165.05.56.06.5点到回归直线的纵向距离平方和为最小!26直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解27 回归系数也有抽样误差! 检验方法针对回归系数b的检验:t检验针对回归方程的检验:F检验4 回归系数的假设检验284 回归系数的

10、假设检验总体回归系数 =0,则回归关系不存在。 H0:总体回归系数为0, =0; H1:总体回归系数不为0,0; =0.05。29回归系数的 t 检验Y的剩余标准差扣除X的影响(即回归所能解释的部分)后Y本身的变异程度30体重与体表面积回归系数的假设检验 H 0:总体回归系数 0,即体重与体表面积无回归关系;H 1:总体回归系数 0,即体重与体表面积有回归关系。 =0.05。 体重与体表面积间存在回归关系。31回归系数与相关系数的假设检验结果等价32直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系

11、数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解335 因变量总变异的分解X P (X,Y)Y345 因变量总变异的分解+ 35Y的总变异分解 未引进回归时的总变异: (sum of squares about the mean of Y) 引进回归以后的变异(剩余): (sum of squares about regression) 回归的贡献,回归平方和: (sum of squares due to regression)36Y的总变异分解 总n

12、1 回1 剩余n2 37直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解38Y的总变异可以用回归来解释的部分即与X有关的部分不能用X来解释的部分即与X无关的部分(随机误差)份额的大小可以用相关系数的平方来衡量(决定系数)6 回归方程的方差分析396 回归方程的方差分析406 回归问题的方差分析 H 0:体重与体

13、表面积间无直线回归关系; H 1:体重与体表面积间有直线回归关系。 = 0.05。lXX=24.9040,lYY=1.5439,lXY=5.9396, SS总= lYY=1.5439SS剩 = lYY lXY / lXX=0.1273 SS回 = SS总-SS剩=1.5439-0.1273=1.416641方差分析表变异来源 SS v MS F P 回 归 1.4166 1 1.4166 89.01 0.001 剩 余 0.1273 8 0.0159 总变异 1.5439 9今11,28,查附表的F界值表,得P0.10,按 = 0.10水准,不拒绝H0,可认为两总体回归系数相等,即两条直线平行

14、。 68公共回归系数bC (common regression coefficient) 加权平均 (lxx)C=(lxx)1+(lxx)2 (lxy)C=(lxy)1+(lxy)2 (lyy)C=(lyy)1+(lyy)269bC (lXX)c=858.6667+1338.9167=2197.5834 (lXY)c= -1427.3333+(2351.25)= -3778.5833 (lYY)c=3044.9167+4900.25=7945.166770H0:两总体回归线高度相等; H0:两总体回归线高度相等 H1:两总体回归线高度不等 =0.20 根据 t 分布原理: 71H0:两总体回归

15、线高度相等;按自由度=12+12-3=21查附表2 t界值表,得t0.10,21=1.721,P0.10,按0.10水准,拒绝H0,可认为两总体回归线的高度不等。72男、女子心率与心脏左室电机械收缩时间的直线回归 5060708090100300350400450收缩时间(毫秒)心率(次/分)男子女子73结论: 男子及女子心率与左心室收缩时间之间均存在线性回归关系,心率越大,收缩时间越短,且两条回归线平行,斜率相同,即男女收缩时间随心率的改变速度相同。但两条线不重叠。74直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的

16、意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解759 直线回归与直线相关的区别与联系 联系均表示线性关系;符号相同:共变方向一致;假设检验结果相同:是否存在共变关系;相关系数 用回归解释相关:76决定系数779 直线回归与直线相关的区别与联系 区别计量单位:r 没有单位,b有单位;应用:相关表示相互关系;回归表示依存关系;对资料的要求:当X和Y都是随机的,可以进行相关和回归分析;当Y是随机的(X是控制的),理论上只能作回归而不能作

17、相关分析; I型回归:X是精确控制的; II型回归:X是随机的。由X推算Y:由Y推算X:78直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解7910 回归分析的正确应用 要有实际意义; 充分利用散点图,判断:(1) 线性趋势(2) 离群值 回归系数的统计学意义; 回归关系可以内插,不宜外延;80 应用条件(LI

18、NE):(1) 线性(linear)(2) 独立(independent)(3) 给定X时,Y正态分布(normal)(4) 等方差(equal variance)10 回归分析的正确应用81给定X时,Y是正态分布、等方差示意图82给定X时,Y是正态分布、不等方差示意图83x x= =x x3 3时的时的E E( (y y) )x x= =x x2 2时时y y的分布的分布x x= =x x1 1时时y y的分布的分布x x= =x x2 2时的时的E E( (y y) )x x3 3x x2 2x x1 1x x= =x x1 1时的时的E E( (y y) ) 0 0 x xyx x= =

19、x x3 3时时y y的分布的分布 0 0+ + 1 1x x10 回归分析的正确应用84男性年龄与血糖的关系 (方差随自变量的增加而增加)glucoseage20304050607080369128526名病人的胃液的pH值及尿中亚硝酸盐浓度的散点图(方差随自变量的增加而增加)尿中亚硝酸盐的浓度胃液的pH值 86直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的

20、区别与联系 10 回归分析的正确应用 11 实例详解87相关与回归实例详解相关与回归实例详解10名3岁男童体重与体表面积关系的分析88例10.1 10名3岁男童体重与体表面积的关系 编号 体重(X,kg) 体表面积(Y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.075 1016.06.411 合计133.457.26689分析思路1. 根据散点图判断是否有线性关系、异常值2. 计算相关系数3. 相关系数的假设检验及可信区间估计4. 建立由体重估计体表

21、面积的回归方程5. 回归系数的假设检验和可信区间估计6. 回归方程的方差分析7. Y估计值的可信区间(带)8. Y值的容许区间(带)901 散点图1112131415165.05.56.06.5体重(kg),X体表面积Y(103cm2)912 相关系数的计算923 相关系数的假设检验H 0:0,体重与体表面积无相关关系;H 1: 0,体重与体表面积有相关关系。 = 0.05。自由度=10-2=8,P0.001 ,拒绝H0,接受H1 ,差别有统计学意义。可以认为3岁男童体重与体表面积之间有正相关关系。93相关系数的可信区间r=0.9579, 则 z 的95%可信区间: 1.91981.960.3

22、780 = (1.1789,2.6607) 的95%可信区间:0.82710.9903 944 回归方程的计算95绘制回归直线 计算不太接近的两点的Y值: X=12kg时 Y=2.5212+0.238512=5.3832(103cm2) X=15kg时 Y=2.5212+0.238515=6.0987(103cm2)96回归图1112131415165.05.56.06.5体重(kg),X体表面积Y(103cm2)975 回归系数的假设检验 H 0:总体回归系数 0,即体重与体表面积无回归关系;H 1:总体回归系数 0,即体重与体表面积有回归关系。 =0.05。 体重与体表面积间存在回归关系。

23、98回归系数 的可信区间估计 根据 t 分布原理估计: 0.23852.3060.02528 0.18020.2968(103cm2/kg)996 方差分析表变异来源 SS v MS F P 回 归 1.4166 1 1.4166 89.01 0.001 剩 余 0.1273 8 0.0159 总变异 1.5439 91007 求 的95%可信区间 =13.44, lXX=24.9040, =0.1262。 当X=12时, =5.3832,101不同X时, 的95可信区间 95%CI X Y Yhat CL CU111.05.283 5.1454.974 5.315211.85.2995.33

24、55.199 5.472312.05.3585.3835.254 5.512412.35.2925.4555.335 5.574513.15.6025.6465.542 5.749613.76.0145.7895.684 5.894714.45.8305.9565.836 6.076814.96.1026.0755.938 6.212915.26.0756.1465.997 6.29610 16.06.4116.3376.151 6.523102 8 的容许区间估计 的100(1- )%容许限:103不同X时, 的95%可信区间与Y的95%容许区间 95%CI 95%TI X Y Yhat C

25、L CU TL TU111.05.283 5.1454.974 5.3155.482 4.807211.85.2995.3355.199 5.4725.657 5.014312.05.3585.3835.254 5.5125.701 5.065412.35.2925.4555.335 5.5745.769 5.140513.15.6025.6465.542 5.7495.954 5.337613.76.0145.7895.684 5.8946.098 5.479714.45.8305.9565.836 6.0766.270 5.641814.96.1026.0755.938 6.2126.39

26、6 5.753915.26.0756.1465.997 6.2966.473 5.81910 16.06.4116.3376.151 6.5236.682 5.992104可信带与容许带示意1112131415164.55.05.56.06.57.01059 结论 该资料采用线性相关与回归分析结果表明,3岁男童体重与体表面积之间存在线性相关关系,相关系数为0.9579 (t=9.435,P0.001)。相关系数的95%CI:0.82710.9903,由体重预测体表面积的回归方程为: (见附图),回归系数的95%可信区间为0.18020.2968(103cm2/kg),该方程的决定系数为0.9175,剩余估计误差为0.1262。106附图:3岁男童体重与体表面积的线性回归1112131415165.05.56.06.5体重(kg),X体表面积Y(103cm2)107108


注意事项

本文(回归分析陆.ppt)为本站会员(nanchangxurui)主动上传,文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文库网(点击联系客服),我们立即给予删除!




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

文库网用户QQ群:731843829  微博官方号:文库网官方   知乎号:文库网

Copyright© 2025 文库网 wenkunet.com 网站版权所有世界地图

经营许可证编号:粤ICP备2021046453号   营业执照商标

1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png