1、回归分析的基本思想及其初步应用 Basic ideas of regression analysis and its preliminary application 人教版高中选修一 1.理解相关关系、回归分析的定义 Understand the definition of correlation and regression analysis 回归分析的基本思想及其初步应用 人教版高中选修一 所求直线方程叫做回归直线方程; 相应的直线叫做回归直线 1 对两个变量进行的线性分析叫做 线性回归分析。 2 回归直线方程 2.求回归直线方程的步骤 Steps to find the regressi
2、on line equation 回归分析的基本思想及其初步应用 人教版高中选修一 步骤 1 求: 2 求: 3 代入公式 4 写出: 直线方程为y=bx+a,即 为所求的回归直线方程 图1.1-2 回归分析的基本思想及其初步应用 人教版高中选修一 探究 身高172cm的女大学生的体重一定是60.316kg吗?如 果不是,其原因是什么? 显然 身高172的女大学生的体重不一定是 60.316,但一般可以认为她的体重接近于 60.316. 假设 随机误差对体重没有影响,也就是说,体重仅受身高的 影响,那么散点图中所有的点将完全落在回归直线 上。 但是 在图中,数据点并没有完全落在回归直线上。这些
3、点 散布在回归直线附近。 那么 探究 EXPLORE 3.残差分析 Residual analysis 表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。 编号 12345678 身高/cm 165165157170175165155170 体重/kg 4857505464614359 残差 -6.3732.6272.419-4.6181.1376.627-2.8830.382 (一)我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以 选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。 回归分析的基本思想及其初步应用 人教版高中选修一 1、坐标纵轴为残
4、差变量,横轴可以有不同的选择; 2、若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域; 3、对于远离横轴的点,要特别注意。 (二 ) 回归分析的基本思想及其初步应用 人教版高中选修一 身高与体重残差图 异 常 点 模型问题 错误数据 残差图的制作及作用 MAKING AND FUNCTION OF RESIDUAL MAP 一般地,建立回归模型的 基本步骤为: GENERALLY, THE BASIC STEPS FOR ESTABLISHING A REGRESSION MODEL ARE: 确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量 01.确定研究对象 02.画出
5、散点图 03.确定方程类型 按一定规则估计回归方程中的参数(如最小二乘法) 04.估计方程中的参数 05.分析异常 画出确定好的解析变量和预报变量的散点图,观察它们之间的关 系(如是否存在线性关系等) 由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性 回归方程y=bx+a) 得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性, 等等),过存在异常,则检查数据是否有误,或模型是否合适等。 回归分析的基本思想及其初步应用 人教版高中选修一 2 对这些关系式的可信程度进行各种统计检验,并 从影响某一特定变量的诸多变量中找出哪些变量 的影响显著,哪些不显著
6、regression analysis 什么是回归分析 ? 内容 1 从一组样本数据出发,确定变量之间的数学关系式 3 利用所求的关系式,根据一个或几个变量的取值来 预测或控制另一个特定变量的取值,并给出这种预 测或控制的精确程度 回归分析的基本思想及其初步应用 人教版高中选修一 回归分析的基本思想及其初步应用 人教版高中选修一 回归分析中,变量 y 称为因变量,处在被解 释的地位,x 称为自变量,用于预测因变量的 变化 回归分析中,因变量 y 是随机变量,自变 量 x 可以是随机变量,也可以是非随机的 确定变量 回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预 测和控制 相关分析主要是描述两个变量之间线性关系 的密切程度; 相关分析中所涉及的变量 x 和 y 都是随机变量 相关分析中,变量 x 变量 y 处于平等的地位 回归分析与相关分析的 区别 Regression and correlation analysis the difference 回 归 分 析 相 关 分 析 THANKS 回归分析的基本思想及其初步应用 人教版高中选修一