商务智能(第5版)课件第4章 在线分析处理.pptx
《商务智能(第5版)课件第4章 在线分析处理.pptx》由会员分享,可在线阅读,更多相关《商务智能(第5版)课件第4章 在线分析处理.pptx(34页珍藏版)》请在文库网上搜索。
1、在线分析处理OLAP概要(1)1970年,关系数据库之父 EFCodd提出了关系模型,促进了在线事务处理(On-Line Transaction Processing,OLTP)的发展。在线事务处理通常是一个或一组记录的查询和修改,用于处理短暂的交易事务,例如银行账目更新、实时库存变化、顾客的订单与发货情况的更新以及病人健康状况的更新等。传统的系统对数据的分析和展现基本是基于二维信息的,当针对不同需求编写相应的二维报表时,会导致报表堆砌和大量的数据冗余。然而在日常决策中,决策者不能仅仅局限于粗略的数据查阅,更要注重精细的数据分析。他们往往需要从多个角度分析问题,以便发现多个变量之间的关系。例如
2、某体育用品销售公司1 月份在哪个国家的什么地区头盔销售处于领先地位?这与销售的多个方面,如产品、销售、数量、地区和时间等有关。这些观察数据的角度称为维。在多维数据上的分析称为在线分析处理(OLAP),也称为多维分析。在线分析处理进行每一次查询都要数千次甚至数万次地对数据进行扫描。传统的 OLTP 很难满足这样复杂的查询。在线分析处理OLAP概要(2)1993年,EFCodd提出了多维数据库和在线分析处理(OLAP)的概念。通常,报表反映了业务状况,告诉管理者发生了什么事情。而要明白为什么发生就需要借助OLAP,例如公司营销业绩让人不满意,什么地方的营销不好?哪些产品的营销出现了问题?OLAP
3、也称为例外分析。OLAP 用于支持复杂的多维分析操作,并最终以一种直观易懂的方式把查询结果返回给分析人员,OLAP 侧重于对中高层管理人员的决策支持。本章主要介绍 OLAP 相关概念、OLAP 与 OLTP 的比较、多维数据操作、OLAP 操作语言、OLAP 工具介绍以及综合实例等内容。OLAP 简介 基本概念(1)变量变量:变量是数据度量的指标,是数据的实际意义。图中的数据“560”本身并没有意义,但如果描述2007年第一季度大中华区 LCD 的销售量是560 万台,则数据560就有了实际意义,代表了产品销售量的度量。年、季度和月份是描述时间的三个层次,10万是变量销售额的值。通常也把变量称
4、为度量。维维:维是与业务主题相关的一组属性,单个属性或属性集合可以构成一维。例如计算机配件销售随着时间推移而产生的变化,这是从时间的角度对产品的销售进行观察。如果把一个主题的多种属性定义为多个维,那么用户就能够从多个角度组合分析销售情况。如图所示,可以从时间维、产品维(CPU、主板、LCD、硬盘、显卡和内存)和地区维(大中华区、北美区、拉丁美洲)分析销售量。OLAP 简介 基本概念(2)维的层次维的层次:一个维往往可以具有多个层次,例如时间维分为年、季度、月和日等层次,地区维可以分为国家、地区、省、市等层次。这里的层次表示数据细化程度,对应概念分层。后面提到的上钻操作就是由低层概念映射到较高层
5、概念。概念分层除了根据概念的全序和偏序关系确定外,还可以通过对数据进行离散化或分组来实现。维的成员维的成员:维是多层次的,不同层次的取值构成一个维成员,例如,某年某季度、某季度某月等都可以是时间维的成员。OLAP 简介 基本概念多维数组多维数组:多维数组用维和度量的组合表示一个多维数组,可以表示为(维1,维2,维n,度量),例如(月份,地区,产品,销售额)组成一个多维数组。数据单元(单元格)数据单元(单元格):多维数组的取值。当多维数组中每个维都有确定的取值时,就唯一确定一个变量的值。数据单元可以表示为(维1成员,维2成员,维n 成员,度量值),例如(2007年第一季度,大中华区,LCD,56
6、0万台)表示一个数据单元:2007 年第一季度大中华区 LCD产品销售560万台。OLAP 简介 基本概念事实事实:事实是不同维度在某一取值下的度量,例如 上述2007年第一季度 LCD 在大中华区的销售额是560万台就表示在时间、产品和地区三个维度上企业销售事实的度量,同时包含时间维度的两个层次:年和季度。有关销售的多维分析视图如图所示。OLAP 简介 OLAP的定义OLAP是由 EFCodd提出,目前已出现了很多在线分析处理的定义:OLAP是一种共享多维信息的快速分析技术;OLAP利用多维数据库技术使用户可以从不同角度观察数据;OLAP用于支持复杂的分析操作,侧重对管理人员的决策支持,可以
7、满足分析人员快速、灵活地进行大数据量的复杂查询的要求,并且以一种直观易懂的形式呈现查询结果,辅助决策;OLAP是针对特定问题的在线数据访问和分析;OLAP是通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理人员对数据进行深人观察。上面定义从各个角度对在线分析处理给予了不同的解释,OLAP 委员会(OLAP Council)则给出了较为正式和严格的定义:在线分析处理是使管理人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的并真实反映业务维特性的信息进行快速、一致和交互的存取,从而获得对数据更深人的理解。OLAP 简介 OLAP的特点OLAP 的多维性、层次、
8、维度计算以及结构与视图的分离等特点。快速、可分析、共享和多维等。OLTP与OLAP的区别在线事务处理是事件驱动、面向应用的,其主要特点是性能要求高,用户数量大。在线分析处理则支持复杂的分析,侧重于为管理人员提供决策支持,并以直观的形式呈现结果。在线事务处理与在线分析处理的主要区别如表所示。OLAP操作在线分析处理比较常用的操作包括切片(slice)与切块(dice)、上钻(drill-up)与下钻(drill-down)以及旋转(rotate)等。在线分析处理还能对多维数据进行深加工。在线分析处理的这些操作使用户从多个视角观察数据,并以图形、报表等多种形式表示,从而获取隐藏在数据中的信息。OL
9、AP操作实例 多维数据OLAP操作实例 切片与切块切片和切片和切块切块:选定多维数组的1维成员做数据分割的操作称为该维上的一个切片。在服装消费实例分析中,对“性别、年龄、月收人”三维立方体选取年龄段进行切片,可得到2630岁年龄段不同月收入人群中男女消费者的购买信息。OLAP操作 切片与切块常把多维数组中选定一个三维子集的操作视为切块。图所示为多维数组(a)选取年龄段2130岁进行切块,可得到此年龄段不同月收人下男女消费者的购买情况(性别,2130岁,月收人,购买百分比)。类似地,多维数组(b)和多维数组(c)均对应多维立方体的切块。OLAP操作 切片与切块当某维只取一个维成员时,便得到一个切
10、片,而切块则是某一维取值范围下的多个切片的叠合。通过对立方体的切片或切块分割,可以从不同视角得到各种数据,包括各个年龄段下女性顾客在不同月收人下的服装购买情况,或者是中档收入下不同年龄段的购买情况。切片与切块的作用是对数据进行过滤,使用户专注于局部信息。OLAP操作 钻取钻取包括上钻、下钻等操作。钻取能够帮助用户获得更多的细节性数据。例如,管理者要了解计划完成情况,可以打开相关的报表查看利润数据。通过与计划值比较,正常的数据显示为绿色,否则显示为红色。红色的数值意味着企业的运营出现了问题,可以进一步查看这些数据的细节,逐层分析问题的所在和原因。图中显示某零售企业销售分析的下钻功能界面。OLAP
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 商务智能第5版课件第4章 在线分析处理 商务 智能 课件 在线 分析 处理