《医学统计学实习指导(临本)2017-9.2 - 用于合并.pdf》由会员分享,可在线阅读,更多相关《医学统计学实习指导(临本)2017-9.2 - 用于合并.pdf(69页珍藏版)》请在文库网上搜索。
1、1 医学统计学实习指导医学统计学实习指导 (供医学本科用)(供医学本科用) 右江民族医学院右江民族医学院 统计教研室编统计教研室编 2014 年年 8 月月 2 前 言 本实习指导融合了全国多所高等医科院校多年来医学统计学实习指导改革的成果,汲取了国内外先进教材的经验,我们在总结了多年的医学统计学实践教学经验的基础上编写了这本教材。内容实用,可操作性强。本书可供临床医学本科、检验医学本科、影像医学本科等医学专业的学生使用,也可供从事医学统计学实验教学的教师参考。 本实验教材分为 6 个章节; 内容涉及 SPSS 简介、 数据文件的建立、 保存、统计描述、t 检验 、2检验、秩和检验和直线相关与
2、回归等内容。为了培养学生灵活运用所学理论及实验知识独立分析和解决问题的能力,实习指导按照例题和联系相结合的模式,使学生对所学的医学统计学知识有更深刻的理解,提高实验的实践操作技能,提高学生学习的主观能动性。 在学生实验训练中,一定要强调做好预习,阅读教材,加强主动性。实验教材的使用过程中可根据教学实际选择不同的例题和课后练习进行教学。 参加本次实验教材的修订工作的有右江民族医学院预防教研室的陆贤杰、马迎教、邓树嵩、郭蕊、李阳、周泽文,特别是马迎教教授和邓树嵩副教授在本书的编写中做出了很多实质性工作并提出了很多有建设性的建议,这些工作和建议弥补了很多编写过程中的不足,大大完善了书中内容,在此向他
3、们深表感谢。 由于编者水平有限,书中难免有不妥之处,望广大师生希望对书中不妥和错误之处批评指正。 编者 二 0 一四年八月 3 目目 录录 实验一实验一 SPSSSPSS 简介、数据文件的建立、保存简介、数据文件的建立、保存4 4 实验二实验二 统计描述统计描述12 12 实验三实验三 t t 检验检验 26 26 实验四实验四 2检验检验36 36 实验五实验五 秩和检验秩和检验4646 实验六实验六 直线相关与回归直线相关与回归6 64 4 4 实验实验一一 SPSS 简介、数据文件的建立、保存简介、数据文件的建立、保存 SPSS(Statistics Package for Social
4、 Science)for Windows 是在 Windows 系统下运行的社会科学统计软件包。SPSS 兼容性好,可以从几乎任何类型的文件中获取数据,然后使用这些数据生成分布和趋势、进行统计描述及统计推断;SPPS 界面友好,使用菜单式操作 Windows 的窗口方式进行数据管理,采用菜单式操作进行数据分析;SPSS 功能强大、包含了绝大部分的统计分析方法,是非统计学专业人员学习、使用统计方法的好工具。 SPSS 自 20 世纪 60 年代诞生以来, 为适应各种操作系统平台的要求经历了多次版本更新,各种版本的 SPSS for Windows 大同小异,在本试验课中我们选择 SPSS 13.
5、0 为例进行讲解。 一、一、SPSS 的启动的启动 在 windows 中选择开始所有程序SPSS for WindowsSPSS 13.0 for Windows即可启动 SPSS 软件,进入 SPSS for Windows 对话框,如图 1.1,图 1.2 所示。图 1.2 中对话框包括一个六选一单选对话框和一个复选对话框,其内容为: 图 1.1 SPSS 启动 Run the tutorial 运行操作指南; Type in data 输入数据选项,建立新的数据集时可选择此项; Run an existing query 运行一个已经存在的数据文件选项; Create new quer
6、y using Database Wizard 用数据库处理工具建立新文件; Open an existing date source 打开一个已经存在的数据文件; Open another type of file 打开其他类型的文件。 Dont show this dialog in the future 是一复选对话框,选中该复选项后,下次启动 SPSS5 时将不会显示对话框,直接显示数据编辑窗口。 图图 1.2 SPSS 启动启动对话框对话框 二、二、SPSS 软件的退出软件的退出 SPSS 软件的退出方法与其他 Windows 应用程序相同,有两种常用的退出方法: (1)按 File
7、Exist 的顺序使用菜单命令退出程序。 (2)直接单击 SPSS 窗口右上角的“关闭”按钮,回答系统提出的是否存盘的问题之后即可安全退出程序。 三、三、SPSS 的主要窗口的主要窗口简介简介 SPSS 软件运行过程中会出现多个界面, 各个界面用处不同。 其中, 最主要的界面有:6 数据编辑窗口、结果输出窗口。 (一)数据编辑窗口 启动 SPSS 后看到的第一个窗口便是数据编辑窗口, 如图 1.3 所示。 在数据编辑窗口中可以进行数据的录入、 编辑以及变量属性的定义和编辑, 数据编辑窗口与微软的 Excel类似,但 SPSS 的统计功能更多。SPSS 的结果输出窗口是显示统计分析的结果,此窗口
8、的内容可以以结果文件.spo 的形式保存。数据编辑窗口和结果输出窗口的详细描述将在有关 SPSS 的数据文件建立的内容中查到。主要由以下几部分构成:标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测序号、窗口切换标签、状态栏。SPSS 对一些基本模块中的统计提供了帮助,可以通过单击 Help 菜单中的 Statistics Coach 命令,选择所需要的帮助。 图图 1.3 数据浏览界面数据浏览界面 标题栏:显示数据编辑的数据文件名。 菜单栏:由 10 个菜单项目组成的主菜单,通过对这些菜单的选择,用户可以进行几乎所有的 SPSS 操作。主要内容有: 菜单栏 工具栏 编辑栏 观测序号 变量名栏 窗
9、口切换标签 状态栏 标题栏 7 File:文件操作。 Edit:文件编辑。 View:视图编辑。 Data:数据操作。 Transform:数据转换。 Analyze:统计分析方法。 Graphs: 图形编辑。 8.Utilities:实用程序。 Windows:窗口控制。 Help:帮助。 工具栏:为了方便用户操作,SPSS 软件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时,会自动跳出一个文本框,提示当前按钮的功能。另外,如果用户对系统预设的工具栏设置不满意,也可以用 ViewToolbars 对工具栏按钮进行定。 编辑栏:可以输入数据,以使它显示在内容区指定的方格里。
10、 变量名栏:列出了数据文件中所包含变量的变量名 观测序号:列出了数据文件中的所有观测值。观测的个数通常与样本容量的大小一致。 窗口切换标签:用于“Data view” (数据视图)和“variable view” (变量视图)的切换。即数据浏览窗口与变量浏览窗口。 Data View 表可以直接输入观测数据值或存放数据, 表的左端列边框显示观测个体的序号,最上端行边框显示变量名。 Variable View 表用来定义和修改变量的名称、类型及其他属性,如图 1.4 所示。 8 图图 1.4 Variable View 表表 在 Variable View 表中,每一行描述一个变量,依次是: N
11、ame:变量名。变量名必须以字母、汉字及开头,总长度不超过 8 个字符,共容纳 4 个汉字或 8 个英文字母,英文字母不区别大小写,最后一个字符不能是句号。 Type:变量类型。变量类型有 8 种,最常用的是 Numeric 数值型变量。其它常用的类型有:String 字符型,Date 日期型,Comma 逗号型(隔 3 位数加一个逗号)等。 Width:变量所占的宽度。 Decimals:小数点后位数。 Label:变量标签。关于变量涵义的详细说明。 Values:变量值标签。关于变量各个取值的涵义说明。 Missing:缺失值的处理方式。 Columns:变量在 Date View 中所显
12、示的列宽(默认列宽为 8) 。 Align:数据对齐格式(默认为右对齐) 。 Measure:数据的测度方式。系统给出名义尺度、定序尺度和等间距尺度三种(默认9 为等间距尺度) 。 如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接输入数据,系统将默认变量 Var00001,Var00002 等。 定义了变量的各种属性后,回到 Data View 表中,就可以直接在表中录入数据。输入数据后可以点击 Save 或 Save as 作为数据文件保存。另外对于统计分析的结果也可以作为文件保存起来。 为了在统计分析过程中能有效的利用其它软件产生的数据, SPSS 软件编辑窗口除可以
13、使用*.sav 扩展名数据文件,还可以直接打开和保存下述类型的文件。 SPSS DOS 版本产生的数据文件*.sys; Excel 报表程序产生的数据文件*.xls; DBASE 数据库格式文件*.dbf; SAS 统计软件产生的数据文件*.sd2。 状态栏:用于说明显示 SPSS 当前的运行状态。SPSS 被打开时,将会显示“SPSS Processor is ready”的提示信息。 (二二)结果输出窗口)结果输出窗口 在 SPSS 中大多数统计分析结果都将以表和图的形式在结果观察窗口中显示。窗口右边部分显示统计分析结果,左边是导航窗口,用来显示输出结果的目录,可以通过单击目录来展开右边窗
14、口中的统计分析结果。当用户对数据进行某项统计分析,结果输出窗口将被自动调出。当然,用户也可以通过双击后缀名为.spo 的 SPSS 输出结果文件来打开该窗口。 四、四、数据的建立数据的建立和和保存保存 (一)创建一个数据文件 1选择菜单 FileNewData 新建一个数据文件,进入数据编辑窗口。 2单击左下角 Variable View 标签进入变量视图界面,根据试验的设计定义每个变量类型。 3变量定义完成以后,单击 Data View 标签进入数据视窗界面,将每个具体的变量10 值录入数据库单元格内。 (二)读取外部数据 以 Excel 文件为例,选择菜单 FileOpenData 调出打
15、开数据对话框,在文件类型下拉列表中选择数据文件类型,选择要打开的 Excel(也可以是其他类型的文件)文件,单击“打开”按钮,调出打开 Excel 数据源对话框,如图 1.5 所示,单击 OK。 图图 1 1.5 Open Excel Data Source.5 Open Excel Data Source 对话框对话框 (三)数据编辑(三)数据编辑 在 SPSS 中,对数据进行基本编辑操作的功能集中在 Edit 和 Data 菜单中。 (四)(四)SPSS 数据的保存数据的保存 SPSS 数据录入并编辑整理完成以后应及时保存,以防数据丢失。选择菜单 FileSave,保存数据文件,如果数据文
16、件曾经存储过,将原文件覆盖;若想存为其他文件,选择 Save as 操作。 11 练习:将以下资料数据输入到 SPSS 的数据编辑窗口中,将民族定义为字符型变量,将身高定义为数值型变量,并保存数据文件,命名为“实验 1-1.sav” 。 姓 名 姓别 年龄 民族 身高(CM) 体重(KG) 白细胞 红细胞 血红蛋白 血小板 敖区翔 男 4 壮族 106 17 5.02 4.72 126 218 蔡霖 男 4 壮族 109 16 7.06 4.91 130 230 陈地婕 女 3 汉族 108 18 5.71 4.04 120 335 陈 杨 男 4 苗族 103 16.5 7.09 5.09
17、135 283 陈利钏 女 6 壮族 113 20 6.91 4.61 139 222 陈琪琪 女 5 汉族 113 18.3 11.66 5.76 113 361 陈达屹 男 4 壮族 103 15 9.27 4.83 140 423 傅俊光 男 4 汉族 109 17.7 9.83 4.61 126 321 12 实验实验二二 统计描述统计描述 建立了数据文件之后,需要对用一些指标如均数、几何均数、中位数、百分位数、标准差、四分位数间距来对数据的集中、离散趋势、分布类型进行描述,这个过程称为统计描述。统计描述在 Analyze 中的 Descriptives 菜单实现,Descriptiv
18、es 菜单中包括frequencies、descriptive、Explore、ratio 四个子菜单,主要功能如下: 1Frequencies 过程:生成频数分布表,适合于分类资料,以及部分数值分类资料; 2Descriptive:进行一般的描述统计统计分析,包括集中趋势值,离散趋势值,偏度系数,峰度系数等。适合服从正态分布的数值变量资料,使用频率最高; 3Explore:适合于数据分布状况不清时的探索性数据分析; 4Ratio:对连个连续性变量计算相对指标。 本次内容主要介绍 Frequencies、Descriptive、Explore 三个菜单。 一、Frequencies 过程 Fr
19、equencies 也称频数分析,可以了解数据的分布状况。 例例 2 2.1.1 对例 1.1 数据进行基本统计分析。 1打开数据文件 SY-3 后,单击 AnalyzeDescriptive Statistics Frequencies 打开频数分析对话框如图 2.1 所示。 图图 2 2. .1 1 FrequenciesFrequencies 对话框对话框 13 2在左边的变量框中选择一个或多个变量进入 Variable(s)。 3选中 Display frequency tables 要求输出分布表。 4 单击 Statistics 按钮, 出现 Frequencies: Statis
20、tics 对话框, 如图 2.2。 在 Frequencies: Statistics 对话框中选择要求输出的统计量。 图图 2 2.2.2 Frequencies: StatisticsFrequencies: Statistics 对话框对话框 (1)Percentile Values 百分数选择项栏(复选项)百分数选择项栏(复选项) Quartile 四分位数, Cut points equal groups 等分位点百分位数(取值范围在 2100 之间) 。 Percentile(s)自定义百分位数。 (2)Dispersion 离差栏离差栏 Std.Deviation 标准差 Min
21、imum 最小值 Variance 方差 Maximum 最大值 Range 极差 S.E.mean 均值的标准误 (3)Central Tendency 集中趋势栏集中趋势栏 Mean 算术平均值(均数), Median 中位数, Mode 众数, Sum 总和. (4)Distribution 分布状态栏分布状态栏 Skewness 偏度 Kurtosis 峰度 在本例中选择四分位数、10 等分的百分位点;标准差、方差、最大、最小值;全距、均值、均值的标准误,中位数、偏度、峰度等复选项,单击 Continue 回到图14 6.1 Frequencies 对话框。 5单击 Chart 按钮,
22、弹出 Frequencies: Chart 对话框,如图 2.3, 。 图图 2 2.3.3 Frequencies: ChartFrequencies: Chart 对话框对话框 在对话框中有: Chart Type 图形栏(单选) ,选择输出的图形类型。 None 不输出图形(系统默许) Bar charts 条形图 Pie charts 饼图 Histograms 直方图 With normal curve 直方图中显示正态曲线(只有选择直方图时才能选择) 。 Chart Values 栏,选择图形中分类值的表现形式。 Frequencies 直方图纵轴为频数,饼图中每块表示属于该组观测
23、值频数; Percentage 直方图纵轴为百分比,饼图中每块表示该组的观测量数占总数的百分比。 6单击 Continue 回到图 2.1Frequencies 对话框,单击 Format 按钮,得到对话框图6.4。 图图 2 2.4.4 Frequencies: Format Frequencies: Format 对话框对话框 15 在 Frequencies: Format 对话框中: Order by 排序栏,表示频数分布表的排列顺序。(单选) Ascending values 按变量值升序排列(系统默认) 。 Descending values 按变量值降序排列。 Ascending
24、 counts 按变量各种取值发生的频数升序排列。 Descending counts 按变量各种取值发生的频数降序排列。 如果设置了直方图,频数表将按照变量值顺序排列。 Multiple Variables 多变量输出表格设置(单选)。 Compare variables 将所有变量的结果输出在一个表中(系统默认) 。 Organize output by variables 为每一个变量输出一个表。 Suppress tables with more than _ categories 控制频数表输出的分类数复选项。Maximum number of categories 分类数最大参数值
25、,默认值是 10。 本例中均选择系统默认项。点击 OK,得到输出表 2.1。 表表2.1 Statistics 身高 体重 白细胞 红细胞 血红蛋白 血小板 N(例数) Valid(有效值) 111 111 111 111 111 111 Missing(有效值) 0 0 0 0 0 0 Mean(均数) 104.19 16.50 7.94 4.62 123.87 280.71 Std. Error of Mean(均数的标准误) .801 .290 .171 .042 .860 6.494 Std. Deviation(标准差) 8.436 3.051 1.799 .444 9.066 68
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学实习指导临本2017-9.2 用于合并 医学 统计学 实习 指导 2017 9.2 用于 合并