数控机床操作教程ppt课件.ppt
《数控机床操作教程ppt课件.ppt》由会员分享,可在线阅读,更多相关《数控机床操作教程ppt课件.ppt(72页珍藏版)》请在文库网上搜索。
1、含量降低这一情况。 lWhy? 事实上,卫星早已监测到了这 一异常情况,但是因为记录显示臭氧 含量过低,从而被卫星上的计算机程 序当成异常样本而过滤掉了! Sources: http:/exploringdata.cqu.edu.au/ozone.html http:/www.epa.gov/ozone/science/hole/size.html 2.5.12.5.1 53 54 异常检测需要解决的问题 l问题 Q数据中有多少离群点? QFinding needle in a haystack 麦芒中找针,沙里淘金 Q异常样本本身是没有类标签的(无监督方法) 有效性检测有一定的困难 (类似于
2、聚类) l必要的假设: Q在数据中,正常样本的数量在一定程度上多于异常样 本。 2.5.22.5.2 54 55 异常样本检测方法 l大致步骤 Q 建立“正常”样本模型 这种模型可以是统计模型也可以是其他的规律性模型 Q 使用正常样本模型检测异常样本 异常样本的特征异于正常模型 l异常监测方法可以有以下类型 Q 基于图形&基于统计模型 Q 基于距离 2.5.22.5.2 55 56 基于图形的方法 l可以使用盒图,散点图 lBoxplot (1-D), Scatter plot (2-D) l缺点 Q耗时 Q比较主观 2.5.22.5.2 56 57 凸包法 l极端点被认为是异常样本。 l使用
3、凸包法监测极端值 l缺点: l无法检测出出现在数据集中心的异常样本。 2.5.22.5.2 57 58 统计方法 l使用参数模型描述样本集的分布情况 (e.g.,正态分布) l统计检测有赖于以下几点 Q数据分布情况 Q统计模型的参数 (如, 样本均值, 方差) Q异常样本的数量 (影响到置信区间的选择) 2.5.22.5.2 了解了解 58 59 统计方法(1):Grubbs检验法 l假设样本分布服从于正态分布 l每次检测一个异常样本,将其从样本集中删去,而后重复 检验以下假设 QH0: 样本集中已没有异常样本 QHA: 样本集中至少还有一个异常样本 lGrubbs检验统计量: l如果下式成立
4、,则拒绝H0 2.5.22.5.2 了解了解 59 60 l假设数据集D包含两种样本,分别产生于不同的概率分 布。 QM (正常样本的分布) QA (异常样本的分布) l大致方法: Q在初始阶段,假设所有样本都服从于M分布。 Q令Lt(D) 为t时刻D的log似然值。 Q对于属于M的每个数据点 xt, 将其移至A 令Lt+1 (D) 为新的log似然值. 计算两者差距 = Lt(D) Lt+1 (D) 如果 c (some threshold), 则认为 xt 是一个异常 样本,并且将其确定为A中的成员。 统计方法(2):最大似然法 2.5.22.5.2 了解了解 60 61 l假设样本分布为
5、混合分布 D = (1 ) M + A lM 为从数据中估计所得的概率分布函数 Q可以基于常见的任何一种建模方法 (如朴素贝叶斯, maximum entropy等等) l假设A为均匀分布 lT时刻的似然函数是: 统计方法(2):最大似然法 2.5.22.5.2 了解了解 61 62 统计方法的缺点 l大多数的统计检验是针对单因素的 l在多数情况下,数据的真实分布并不知道 l对于高维度数据,有可能难以估计真实的分布情况 2.5.22.5.2 62 63 基于距离的方法 l数据由一个特征向量代表 l基于距离的方法主要有以下三种 Q最近邻法 Q基于密度的方法 Q基于聚类的方法 2.5.22.5.2
6、 63 64 最近邻法 方法: l计算每对数据点之间的距离 l可以使用以下方法识别出异常样本 Q 在距离D 的半径内,邻近数据点的个数少于p个。 Q 距其第K个近邻的距离最大的n个样本 Q 距其K-近邻的平均距离最大的n个样本 lN=100, = 5 2.5.22.5.2 64 65 基于密度的方法: LOF 方法 l对于每个样本,计算其局部邻居点的密度 l计算样本p的局部离群因子,即样本p 及其最近邻样本的平均 密度。 l具有最大LOF值的那些样本点即是异常点。 p2 p1 In the NN approach, p2 is not considered as outlier, while
7、LOF approach find both p1 and p2 as outliers 2.5.22.5.2 了解了解 65 66 基于聚类的方法 l基本思想 Q根据样本的不同密度将数 据聚成若干个簇 Q考察样本数量较少的那些 簇,将他们列为可疑样本 ,进行下一步分析。 Q计算可疑样本与其他样本 簇之间的距离 如果可疑样本距离其他 所有非可疑样本簇都很 远,则可判断他们就是 异常样本。 2.5.22.5.2 66 67 人防数据中心建设方案 1 议程 l l 现状与问题现状与问题 l l 目标与作用目标与作用 l l 整体思路及架构整体思路及架构 l l 整体规划整体规划 l l 资源目录管
8、理资源目录管理 l l 数据共享交换平台数据共享交换平台 l l 四大基础数据库四大基础数据库 l l 决策支持系统决策支持系统 2 人防信息化过程中出现的问题人防信息化过程中出现的问题 l l 数据难以利用数据难以利用 l l 系统孤立形成信息孤岛系统孤立形成信息孤岛 l l 缺乏公共服务与决策支持缺乏公共服务与决策支持 l l 信息无法共享与交换信息无法共享与交换 l l 统计口径不一致统计口径不一致 l l 数据价值难以体现数据价值难以体现 l l 缺乏监控与预测缺乏监控与预测 l l 3 议程 l l 现状与问题现状与问题 l l 目标与作用目标与作用 l l 整体思路及架构整体思路及
9、架构 l l 整体规划整体规划 l l 资源目录管理资源目录管理 l l 数据共享交换平台数据共享交换平台 l l 四大基础数据库四大基础数据库 l l 决策支持系统决策支持系统 4 人防数据中心的目标 l l 是人防信息资源数据库的存储中心和管理服务中心是人防信息资源数据库的存储中心和管理服务中心 l l 是人防数据交换中心。在省级人防和各级人防间、是人防数据交换中心。在省级人防和各级人防间、 同级人防各部门间、各级人防相互间、各级人防和同级人防各部门间、各级人防相互间、各级人防和 公众间实现电子公文等的数据交换公众间实现电子公文等的数据交换 l l 是网上政务服务系统的公众数据交换中心是网
10、上政务服务系统的公众数据交换中心 l l 是人防的决策支持中心,进行数据挖掘、分析、比是人防的决策支持中心,进行数据挖掘、分析、比 较,提供辅助决策信息较,提供辅助决策信息 5 建立人防数据中心的意义(一) l l 规范化的人防信息模型规范化的人防信息模型 l l 数据整合:整合各职能机构数据整合:整合各职能机构“ “信息孤岛信息孤岛” ”中的数据中的数据 l l 信息模型:统一的人防信息标准和模型信息模型:统一的人防信息标准和模型 l l 数据共享、交换和应用平台数据共享、交换和应用平台 l l 数据共享:跨职能部门和机构的信息共享数据共享:跨职能部门和机构的信息共享 l l 数据交换:作为
11、集中的数据交换中心平台数据交换:作为集中的数据交换中心平台 l l 应用平台:作为公共的应用服务平台服务分散的应用应用平台:作为公共的应用服务平台服务分散的应用 l l 数据中心应用:包含报表,分析,数据挖掘和业务监控等数据中心应用:包含报表,分析,数据挖掘和业务监控等 l l 高效的人防信息化管理设施高效的人防信息化管理设施 6 建立人防数据中心的意义(二) l l 数据共享数据共享 l l 全面整合:把各个职能机构的数据整合到数据中心全面整合:把各个职能机构的数据整合到数据中心 l l 统一正确:完善的数据质量管理保障数据的正确性统一正确:完善的数据质量管理保障数据的正确性 l l 方便访
12、问:各个职能机构可以方便快捷的访问数据方便访问:各个职能机构可以方便快捷的访问数据 l l 数据交换数据交换 l l 集中存储:建立集中的数据交换中心平台集中存储:建立集中的数据交换中心平台 l l 信息传输:自动发送信息到相应的机构人员信息传输:自动发送信息到相应的机构人员 l l 快速响应:根据需要快速的组织决策数据快速响应:根据需要快速的组织决策数据 l l 自助式行政事务:简化工作流程、灵活发布信息自助式行政事务:简化工作流程、灵活发布信息 7 建设原则 l l 政务系统一体化的原则政务系统一体化的原则 l l 实用性和经济性原则实用性和经济性原则 l l 普遍联系性和相对独立性原则普
13、遍联系性和相对独立性原则 l l 先进性和开放性原则先进性和开放性原则 l l 成熟性和标准性原则成熟性和标准性原则 l l 可靠性和稳定性原则可靠性和稳定性原则 l l 安全性和保密性原则安全性和保密性原则 l l 可扩展性和易维护性原则可扩展性和易维护性原则 l l 数据的有效性和完整性原则数据的有效性和完整性原则 8 议程 l l 现状与问题现状与问题 l l 目标与作用目标与作用 l l 整体思路及架构整体思路及架构 l l 整体规划整体规划 l l 资源目录管理资源目录管理 l l 数据共享交换平台数据共享交换平台 l l 四大基础数据库四大基础数据库 l l 决策支持系统决策支持系
14、统 9 人防数据中心整体工作思路 项目管理过程 基础架构(中间件) 数据整合 应用整合 流程整合 管理整合 集 成 体 系 结 构 设 计 资 源 目 录 / 元 数 据 管 理 数 据 中 心 利 用 决策分析 流程再造 应用增强 资源调整 用 户 及 安 全 集 成 应用及流程整合规划 技 术 及 产 品 选 型 解 决 方 案 准 备 就 绪 解 决 方 案 实 施 建 议 数据资源整合规划 项 目 策 略 开 发 现状 分析 现状 分析 应用 流程 分析 应用 流程 模型 设计 全局 数据 模型 数据 质量 分析 数据中心的循环过程 规划 整合 利用 平台调整 10 主要技术关键点 l
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数控机床 操作 教程 ppt 课件