六西格玛数据分析技术.pdf
《六西格玛数据分析技术.pdf》由会员分享,可在线阅读,更多相关《六西格玛数据分析技术.pdf(347页珍藏版)》请在文库网上搜索。
1、SSMC中国人民大学六西格玛质量管理研究中心中 国 人 民 大 学 出 版 社中国人民大学音像出版社SSMC中国人民大学六西格玛质量管理研究中心中国人民大学六西格玛质量管理研究中心中国人民大学六西格玛质量管理研究中心六西格玛管理培训丛书六西格玛管理培训丛书何晓群 主编何晓群 主编中国人民大学出版社中国人民大学出版社SSMC中国人民大学六西格玛质量管理研究中心六西格玛管理培训丛书(5)? 何晓群 主编何晓群 主编六西格玛数据分析技术六西格玛数据分析技术何晓群 编著光盘作者:陶沙苏晨辉中 国 人 民 大 学 出 版 社SSMC中国人民大学六西格玛质量管理研究中心目 录课程概要第1章基本统计概念第2
2、章概率及其应用第3章管理中常见的几个概率分布第4章参数估计第5章假设检验第6章离散数据的卡方检验第7章方差分析第8章相关分析与一元回归第9章多元回归分析退出放映SSMC中国人民大学六西格玛质量管理研究中心课程概要? 课程要点? 培养对象? 欲达目的? 课时安排返回目录SSMC中国人民大学六西格玛质量管理研究中心课程要点1.数据收集与整理描述2.概率及其在质量管理中的应用3.质量管理中常见的几个概率分布4.参数估计及其应用5.假设检验及其应用6.离散数据的卡方检验7.方差分析及其应用8.相关分析与一元回归9.多元回归及其应用返回目录SSMC中国人民大学六西格玛质量管理研究中心培养对象开展六西格玛
3、管理项目的黑带及黑带大师候选人和掌握统计技术与方法应用的人。返回目录SSMC中国人民大学六西格玛质量管理研究中心欲达目的通过本课程的学习你将达到:1.理解统计数据分析主要方法的基本理论2. 树立起六西格玛管理的统计思想3. 掌握了基本统计方法在管理中的应用4. 能熟练运用Minitab软件实现数据分析5. 建立起运用统计方法解决管理问题的能力返回目录SSMC中国人民大学六西格玛质量管理研究中心课时安排(36课时)第1章基本统计概念4课时第2章概率及其应用4课时第3章管理中常见的几个概率分布4课时第4章参数估计4课时第5章假设检验4课时第6章离散数据的卡方检验4课时第7章方差分析4课时第8章相关
4、分析与一元回归4课时第9章多元回归分析4课时返回目录SSMC中国人民大学六西格玛质量管理研究中心第1章 基本统计概念1.1 常用数据分析技术概述1.2 总体与样本1.3 数据的收集1.4 数据的类型1.5 数据集中趋势的测度1.6 数据离散程度的测度1.7 数据基本分析的软件实现小组讨论与练习返回目录SSMC中国人民大学六西格玛质量管理研究中心本 章 目 标1. 理解数据分析在6管理中的重要意义2. 理解几个常见的统计概念3. 树立企业管理人员量化管理的统计意识4. 掌握几种不同平均数的计算方法5. 掌握标准差和变异系数的计算方法返回目录SSMC中国人民大学六西格玛质量管理研究中心1.1 常用
5、数据分析技术概述界定界定Define界定界定Define量测量测Measure量测量测Measure分析分析Analyze分析分析Analyze改进改进Improve改进改进Improve控制控制Control控制控制Control量测所得各种数据量测所得各种数据Data返回目录SSMC中国人民大学六西格玛质量管理研究中心数据分析的意义界定界定Define界定界定Define量测量测Measure量测量测Measure分析分析Analyze分析分析Analyze改进改进Improve改进改进Improve控制控制Control控制控制Control6管理目标顾客满意管理目标顾客满意返回目录SS
6、MC中国人民大学六西格玛质量管理研究中心可靠的数据及分析是解决问题的根本管理中的问题管理中的问题如何解决现在的问题如何解决现在的问题确认问题确认问题设计量测指标设计量测指标选择收集数据的方法选择收集数据的方法获得数据获得数据分析数据分析数据历史的历史的近期的近期的最新的最新的得到分析结果制定解决方案得到分析结果制定解决方案决策及行动决策及行动返回目录SSMC中国人民大学六西格玛质量管理研究中心1.2 总体与样本总体?=X这个企业员工的月平均收入是多少?=niinxx1/信息由样本信息作为总体信息估计值从总体中抽取一小部分x样本返回目录SSMC中国人民大学六西格玛质量管理研究中心总体、个体与样本
7、、样品总体(population):把研究的一类对象的全体称为总体。个体(individual,item):把构成总体的每一个成员称为个体。样本(sample):从总体中抽出的部分个体组成的集合称为样本。样品:样本中包含的个体成为样品。样本容量(sample size):样本中包含的个体的数量称为样本容量,通常用n表示。返回目录SSMC中国人民大学六西格玛质量管理研究中心1.3 数据的收集6管理是一种科学的量化管理没有数据就没有管理没有数据的统计分析就等于无米之炊数据资料的来源有两种:原始资料和二手资料抽样是企业管理中收集数据的最普遍方法宏观数据资料的获取主要依赖于各种统计年鉴和咨询顾问公司返
8、回目录SSMC中国人民大学六西格玛质量管理研究中心关于抽样方法概率抽样和非概率抽样概率抽样(随机性原则)非概率抽样配额抽样简单随机抽样(simple random sampling)分层抽样(stratified sampling)整群抽样(cluster sampling)等距抽样。又称系统抽样(systematic sampling)返回目录SSMC中国人民大学六西格玛质量管理研究中心1.4 数据的类型6管理中通常遇到两种类型的数据:定性数据定性数据定量数据定量数据定类数据定类数据定序数据定序数据计量数据计量数据计数数据计数数据数据是决策的依据返回目录SSMC中国人民大学六西格玛质量管理研
9、究中心定量数据定量数据定量数据计量数据计量数据计数数据计数数据返回目录SSMC中国人民大学六西格玛质量管理研究中心计量数据连续型数据怎样获得计量数据连续型数据连续型数据连续型数据连续型数据返回目录SSMC中国人民大学六西格玛质量管理研究中心计数数据离散型数据计数或事件发生的频率:如,顾客满意度调查中不满意的人数。需要较大的样本量,以更好地描述产品或服务的某种特性。满意的和不满意的人数就是数出来的满意的和不满意的人数就是数出来的瓷砖中的斑点数瓷砖中的斑点数返回目录SSMC中国人民大学六西格玛质量管理研究中心变量、参数和统计量变量是说明和描述事物某种特征的指标变量的种类参数统计量变量的种类变量的种
10、类分类变量分类变量顺序变量顺序变量数值型变量数值型变量随机变量随机变量连续型随机变量连续型随机变量离散型随机变量离散型随机变量返回目录SSMC中国人民大学六西格玛质量管理研究中心1.5 数据集中趋势的测度反映样本位置的统计量样本均值设有样本数据xnxxx,.,21=niixnx11x就是样本均值样本中位数:将样本数据按从小到大排序后,处于中间位置上的数就是中位数。返回目录SSMC中国人民大学六西格玛质量管理研究中心加权算术平均数加权算术平均数=niiixx1其中为 的权重(weight),表示 在数据集中所占的比重,而iixix=niii10 ; 1当权重相同,即nini,.,2 , 1 ,
11、1=时加权算术平均数即为简单算术平均数。返回目录SSMC中国人民大学六西格玛质量管理研究中心几何平均数将所有n个数连乘,然后开n次方,即nxxx,.,21nniinngxxxxx=121.其中: 代表几何平均数,为连乘符号当n2时,为了方便计算可采用对上式两边取对数的方法计算:gx=+=niingxnxxxnx121log1)log.log(log1log几何平均数一般用于计算在一段时间内有复式增长的数据的均值几何平均数(geometric mean)注意注意返回目录SSMC中国人民大学六西格玛质量管理研究中心几何平均数(续)1497. 18 . 04 . 13 . 12 . 14=HPR几何
12、平均数适用于计算在一段时间内有复式增长的数据的均值情况。4 .174$1.1497$1004=这在企业中要经常用到。如企业成长10年来每年有个增长率,试计算这10年的平均增长率;1995年2004年每年有个国内生产总值GDP的增长率,求1995年到2004年的平均增长率。例:某投资者于2000年、2001年、2002年及2003年的持有期回报(HPR)分别为1.2、1.3、1.4及0.8。试计算该投资者在这四年内的平均持有期回报。解:利用几何平均数计算持有期回报:平均该投资者平均每年持有期回报为1.1497。如果该投资者在2000年初投资额为100,那么到2003年底,他的财富将成为。返回目录
13、SSMC中国人民大学六西格玛质量管理研究中心1.6 数据离散程度的测度一批统计数据相对它的均值而言,这些数据的离散程度如何?数据波动的统计量通常有三种:样本方差与样本标准差样本方差与样本标准差数据波动的统计量极差极差变异系数变异系数返回目录SSMC中国人民大学六西格玛质量管理研究中心极差(range)极差的计算简单,它是一种最简单的度量离散程度的方法。极差的缺点也很明显,因为它只考虑了极端值,丢失的数据信息较多。现在的社会居民收入分配相差很大,这对社会稳定很不利。极差让我们可以更清醒地认识到贫富差距。所以极差还是很有意义的一个统计量。一组数据中的最大值与最小值之差称为极差,用R表示。极差的计算
14、十分简单,如某企业中员工的最大月收入是12000元,最低月收入是800元,则R1200080011200(元)返回目录SSMC中国人民大学六西格玛质量管理研究中心方差与标准差总体方差总体标准差样本方差样本标准差实际应用中常用样本标准差作为总体标准差的估计值。方差不能带量纲(单位),这样就得不到合理解释; 只有标准差才能带单位。NXXNii=122)(1)(12=nxxsnii1)(122=nxxsniiNXXNii=12)(返回目录SSMC中国人民大学六西格玛质量管理研究中心均值与标准差概念的直观理解设有两组样本数据分别为:2、4、6、8、104、5、6、7、8把这两组数据分别标在下面的直线轴
15、上0024681045678返回目录SSMC中国人民大学六西格玛质量管理研究中心均值与标准差概念的直观理解(续)第一组数据的16.34)610()68()66()64()62(22222=+=s6)108642(51=+=x第二组数据的6)87654(51=+=x58.14)68()67()66()65()64(22222=+=s由这两组数据的均值和标准差,结合上面的图形,我们可以直观地看到这两组数据均以6为中心,但前面5个数的离散程度要大于后面5个数的离散程度。第一组数的标准差是3.16,第二组数的标准差1.58。这个例子让我们更直观地体会到标准差以及均值的意义。返回目录SSMC中国人民大学
16、六西格玛质量管理研究中心变异系数例13:设有甲、乙两个企业,他们职工月奖金的平均 数及标准差如下(单位:元)10 , 100=sx6 . 9 , 80=sx试问甲、乙两个企业哪个企业职工的月平均奖金相差较大?你怎么判断这个问题,你的答案是什么?乙:甲:返回目录SSMC中国人民大学六西格玛质量管理研究中心1.7 数据基本分析的软件实现StatBasic StatisticsDisplay DescriptiveStatistics Store Descriptive Statistics 返回目录SSMC中国人民大学六西格玛质量管理研究中心基本输出结果1Display Descriptive S
17、tatistics 在绘图窗口的输出分布图箱形图置信区间返回目录SSMC中国人民大学六西格玛质量管理研究中心基本输出结果2Display Descriptive Statistics 程序输出窗口Store Descriptive Statistics 在工作表中的结果输出关于身高数据的统计量分析返回目录SSMC中国人民大学六西格玛质量管理研究中心小组讨论与练习1. 试举本企业中关于总体、样本、个体和样品的例子。2. 试举实际问题中哪些数是连续型数据,哪些数是离散型数据。3. 某企业2000年到2003年的销售收入增长率分别是15、20、 23、28,请问这四年的销售收入平均增长是多少?4.
18、从某啤酒厂的一批瓶装啤酒中随机抽取了10瓶,测得装量分别为:(单位:ml)640、639、636、641、642、638、639、643、636、639 试计算样本均值与样本标准差。5. 从某厂生产的两种不同规格的车轴中,各随机抽取了20根,测得它们的直径的均值与标准差分别为甲产品乙产品试问哪种产品的质量波动大?mmsmmx01.1 , 40=mmsmmx1.2 , 120=返回目录SSMC中国人民大学六西格玛质量管理研究中心第2章 概率及其应用2.1 掷骰子的游戏2.2 概率及概率的计算2.3 概率的性质与运算法则2.4 条件概率2.5 独立性2.6 全概率公式2.7 贝叶斯公式2.8 概率
19、树小组讨论与练习返回目录SSMC中国人民大学六西格玛质量管理研究中心本 章 目 标1. 理解随机事件及其概率的基本思想2. 掌握概率的性质与运算法则3. 理解条件概率与事件的独立4. 理解优质产品不是检验出来的理念5. 掌握全概率公式和贝叶斯公式的应用6. 会运用概率树解决有关问题返回目录SSMC中国人民大学六西格玛质量管理研究中心2.1 掷骰子的游戏?一枚骰子掷下去后点数为1、2、3、4、5、6各出现的可能性有多大??我们大家都知道一枚骰子掷下去后,各个点数出现的机会均等,每个点数出现的可能性都是1/6。可能性大小可能出现的点数1/61/61/61/61/61/6返回目录SSMC中国人民大学
20、六西格玛质量管理研究中心一个顾客的期望?设有一对完全相同的骰子,把这一对骰子随机掷下,一对骰子两两组合的点数最多出现11种结果,这种结果的组合点数可能是2、3、4、5、6、7、8、9、10、11、12。?有位顾客,仅仅需要能两两组合成4、5、6、7、8、9、10、11的结果。请问能使这位顾客期望实现的概率有多大?不能使这位顾客满意的风险是多大?返回目录SSMC中国人民大学六西格玛质量管理研究中心骰子骰子2点数组合点数组合骰子骰子1一对骰子出现的全部组合有多少?121110987111098761098765987654876543765432返回目录SSMC中国人民大学六西格玛质量管理研究中心
21、骰子骰子2每个组合的概率每个组合的概率骰子骰子1一共有36个组合,每个组合出现的概率是1/36=0.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.0278?骰子1与骰子2分别出现任何给定值的概率都等于骰子1与骰子2
22、分别出现任何给定值的概率都等于1/6?任一给定组合发生的概率任一给定组合发生的概率0278. 06161=返回目录SSMC中国人民大学六西格玛质量管理研究中心2.2 概率及概率的计算?古典概型随机事件常用大写的英文字母A、B、C等表示。随机事件A的概率,用P(A)表示?统计概型其中:n表示相同情况下试验的次数,m表示某事件A出现的次数,比值m/n称为事件A发生的频率。nmAAP=事件个数样本空间所包含的基本数所包含的基本事件的个事件)(pnmAP=)(返回目录SSMC中国人民大学六西格玛质量管理研究中心计算组合点数出现的概率0.02781120.05562110.08333100.111149
23、0.1389580.1667670.1389560.1111450.0833340.0556230.027812概率组合个数(m)出现的组合点值返回目录SSMC中国人民大学六西格玛质量管理研究中心能使那位顾客满意的程度有多大?2345678910111202%出现的组合点数概 率8.34%LSLUSL2.78%4%8%6%16%14%12%10%18%返回目录SSMC中国人民大学六西格玛质量管理研究中心2.3 概率的性质与运算法则?概率的公理化定义在研究随机现象中,把表示随机事件A发生的可能性大小的实数称为该事件的概率,用P(A)表示。前苏联的柯莫哥洛夫于1933年给出如下的概率公理化定义:1
24、. 非负性:对任一随机事件A,有2. 规范性:必然事件的概率为1,而不可能事件的概率为0,即3. 可加性:如果A与B是两个互不相容事件(互斥),则0AP)(1)(=P0)(=P)()()(BPAPBAP+=返回目录SSMC中国人民大学六西格玛质量管理研究中心概率的性质与计算?由概率的公理化定义不难得到概率的其它许多性质,如:互为对立事件。与其中AAAPAP .)(1)(1=退化为可加性公理。此性质互不相容时,与当所示。如图与事件事件 ,PABPBA BA ABPBPAPBAP 2.0)()(1)()()()(=+ += =图图1BA返回目录SSMC中国人民大学六西格玛质量管理研究中心2.4 条
25、 件 概 率?在现实世界中,任何随机试验都是在一定条件下进行的。这里我们要讨论的条件概率,则是当试验结果的部分信息已知(即在原随机试验的条件下,再加上一些附加信息)。例如当某一事件B已经发生时,求事件A发生的概率,称这种概率为事件B发生条件下事件A发生的条件概率,记为P(A|B)?由于增加了新的条件(附加信息),一般来说,P(A|B)P(A)。返回目录SSMC中国人民大学六西格玛质量管理研究中心乘 法 公 式(2)()()( BPB|APABP= =?由前一页最后的结果,我们看到条件概率有如下的计算公式:) 1 ()()()()( 0BP BPABPB|AP=即条件概率可由两个无条件概率之商来
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 六西格玛 数据 分析 技术