回归分析陆.ppt
《回归分析陆.ppt》由会员分享,可在线阅读,更多相关《回归分析陆.ppt(108页珍藏版)》请在文库网上搜索。
1、Linear regression线性回归易洪刚Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University两指标间的关系分析1 直线相关分析 (Linear Correlation Analysis) 直线回归分析 (Linear Regression Analysis) 总结 (Summary)CONTENTS2直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设
2、检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解3引言 对于2岁时的身高和成年后身高间的关系,相关关系; 即便具有相同的2岁身高,成年后的身高也不一定相同; 2岁身高X与成年后身高Y的散点图Y 成年后的身高(英寸)X 两岁时的身高(英寸)30323436384063656769714引言 对于女大学生的体重和肺活量间的关系 即便具有相同的体重,肺活量也不一定相同;Y 肺活量(L)X 体重(kg)40602.04.03.02.53.5504555女大学生体重(X)
3、与肺活量(Y)的散点图5折衷的解释 虽然它们之间有数量关系,但并非确定性的数量关系。 是一种宏观的关系!6直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解7 回答“变量之间是什么数量关系?”; 宏观上来讲,他们呈直线关系,但并不能用来描述。所以我们用回归方程:“hat”表示估计值,给定x时y的条件均数。2 直线
4、回归方程的建立82 直线回归方程的建立 Y 因变量 (dependent variable, response variable) X 自变量 (independent variable, explanatory variable) 直线回归的形式:9不同斜率时回归直线的表现XY10Regression Regression 释意释意112 直线回归方程的建立 最小二乘法(least square estimation)12例 某地10名三岁儿童体重与体表面积 X Y (体重,kg) (体表面积,103cm2 )11.0 5.28311.8 5.29912.0 5.35812.3 5.2921
5、3.15.60213.7 6.01414.4 5.83014.9 6.10215.2 6.07516.0 6.4111310名3岁男童体重与体表面积散点图1112131415165.05.56.06.5体重(kg),X体表面积Y(103cm2)14体重与体表面积的回归15回归直线的绘制 计算不太接近的两点的Y值: X=12kg时 Yhat=2.5212+0.238512=5.3832(103cm2) X=15kg时 Yhat=2.5212+0.238515=6.0987(103cm2)1610名3岁男童体重与体表面积回归图1112131415165.05.56.06.5体重(kg),X体表面积
6、Y(103cm2)17直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解183 回归系数和回归方程的意义及性质b 的意义a 的意义 的意义 的意义 的意义19b 的意义 斜率(slope) 体重与体表面积的关系 2.5212 + 0.2385 X 体重每增加 1 kg, 则体表面积平均增加 0.2385(103c
7、m2)nb 的单位为 (Y的单位/X的单位)20a 的意义 a 截距(intercept, constant) X=0 时,Y的估计值 A的单位与Y值相同 当X可能取0时,a才有实际意义。21估计值 的意义 X=11时, =5.145, 即体重为 11 kg 的三岁男童, 其平均体表面积之估计为 5.145 (103cm2);X=15时, =6.099, 即体重为 15 kg 的三岁男童, 其平均体表面积之估计为 6.099 (103cm2). 给定X时,Y的估计值。 当 时,22由体重(kg)估计体表面积(103cm2 ) X Y Y 的估计值 (体重,kg) (体表面积)11.0 5.28
8、35.14511.8 5.2995.33612.0 5.3585.38312.3 5.2925.45513.1 5.6025.64613.76.0145.78914.4 5.8305.95614.9 6.1026.07515.2 6.0756.14616.0 6.4116.33723Y 体重增量(g)X 进食量(g)6007008009001000110120130140150160170180190 的意义 为残差(residual) :点到直线的纵向距离24 残差平方和 (residual sum of squares). 综合表示点距直线的距离。 在所有的直线中,回归直线的残差平方和是最
9、小的。(最小二乘) 的意义25点到直线的距离1112131415165.05.56.06.5点到回归直线的纵向距离平方和为最小!26直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解27 回归系数也有抽样误差! 检验方法针对回归系数b的检验:t检验针对回归方程的检验:F检验4 回归系数的假设检验284 回归系数的
10、假设检验总体回归系数 =0,则回归关系不存在。 H0:总体回归系数为0, =0; H1:总体回归系数不为0,0; =0.05。29回归系数的 t 检验Y的剩余标准差扣除X的影响(即回归所能解释的部分)后Y本身的变异程度30体重与体表面积回归系数的假设检验 H 0:总体回归系数 0,即体重与体表面积无回归关系;H 1:总体回归系数 0,即体重与体表面积有回归关系。 =0.05。 体重与体表面积间存在回归关系。31回归系数与相关系数的假设检验结果等价32直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系
11、数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解335 因变量总变异的分解X P (X,Y)Y345 因变量总变异的分解+ 35Y的总变异分解 未引进回归时的总变异: (sum of squares about the mean of Y) 引进回归以后的变异(剩余): (sum of squares about regression) 回归的贡献,回归平方和: (sum of squares due to regression)36Y的总变异分解 总n
12、1 回1 剩余n2 37直线回归分析(linear regression analysis) 1 引言 2 回归方程的建立 3 回归系数和回归方程的意义及性质 4 回归系数的假设检验 5 应变量总变异的分解 6 回归问题的方差分析 7 与直线回归有关的区间估计 8 过定点的直线回归 9 直线回归与直线相关的区别与联系 10 回归分析的正确应用 11 实例详解38Y的总变异可以用回归来解释的部分即与X有关的部分不能用X来解释的部分即与X无关的部分(随机误差)份额的大小可以用相关系数的平方来衡量(决定系数)6 回归方程的方差分析396 回归方程的方差分析406 回归问题的方差分析 H 0:体重与体
13、表面积间无直线回归关系; H 1:体重与体表面积间有直线回归关系。 = 0.05。lXX=24.9040,lYY=1.5439,lXY=5.9396, SS总= lYY=1.5439SS剩 = lYY lXY / lXX=0.1273 SS回 = SS总-SS剩=1.5439-0.1273=1.416641方差分析表变异来源 SS v MS F P 回 归 1.4166 1 1.4166 89.01 0.001 剩 余 0.1273 8 0.0159 总变异 1.5439 9今11,28,查附表的F界值表,得P0.10,按 = 0.10水准,不拒绝H0,可认为两总体回归系数相等,即两条直线平行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析