数控车床复合循环指令编程ppt课件.ppt
《数控车床复合循环指令编程ppt课件.ppt》由会员分享,可在线阅读,更多相关《数控车床复合循环指令编程ppt课件.ppt(57页珍藏版)》请在文库网上搜索。
1、Data mining & Business Intelligence 数据挖掘与商务智能 1 2 课程内容 预备知识1 数据挖掘(DM)2 商业智能(BI)3 数据挖掘的含义数据挖掘的含义& &任务任务 数据质量数据质量 数据预处理数据预处理 汇总统计、数据可视化汇总统计、数据可视化&OLAP&OLAP 分类、分类、关联分析、聚类分析、异常检测关联分析、聚类分析、异常检测 各类数据挖掘工具简介各类数据挖掘工具简介 BIBI的含义的含义& &案例案例 数据挖掘技术在数据挖掘技术在BIBI中的应用中的应用 面向服务架构面向服务架构&BI&BI 参考书籍:参考书籍: Introduction to
2、 Data MiningIntroduction to Data Mining 美美P. N. Tan et.al. P. N. Tan et.al. 参考书籍:参考书籍: Materials from the InternetMaterials from the Internet 商务智能与数据挖掘商务智能与数据挖掘Microsoft Microsoft SQL serverSQL server应用,应用, 谢邦昌 课件下载邮箱:课件下载邮箱: gdutwwgdutww Psw: gdutww Psw: gdutww 2 3 2 数据挖掘具体方法 2.3 2.3 关联分析关联分析 怎样进行
3、关联规则挖掘 基本概念 3 4 基本概念:关联规则挖掘 l关 :关 是形如X-Y的涵表达式,其中X和Y是不相交 的集,即 。 l关 挖掘:从一个数据集中 关 , 示了定 数据集中常一起出的属性条件元。 Market-Basket 事务集 Example of Association Rules Diaper Beer, Milk, Bread Eggs,Coke, Beer, Bread Milk, 注意:两个事务组相互关联,只是 两者经常同时发生,而并不一定是 两者一定具有因果关系。 2.3.12.3.1 4 5 实例 通 客放入其物中不 同商品之的系,分析客的 。通了解哪些商品繁地被 客同
4、 ,种关的 可以帮 助零售商制定 策略。例如,在同 一次物中,如果客 牛奶的同 ,也 面包(和什么型的面包 )的可能性有多大? 种信息可以引 售,可以帮助 零售商有 地 和安排架。例 如,将牛奶和面包尽可能放近一些, 可以一步引客在商店里同 些商品。 Customer buys diaper Customer buys both Customer buys beer “啤酒与尿布”的关联规则 2.3.12.3.1 5 6 一些基本定义 l项集 Q 一个或多个项的集合 如: Milk, Bread, Diaper Q k-项集 包含有k个子项的项集 l支持度计数 () Q 一个项集在事务集中出现
5、的频率 Q E.g. (Milk, Bread,Diaper) = 2 l支持度 Q 包含某个项集的事务数量比例 Q E.g. s(Milk, Bread, Diaper) = 2/5 l频繁项集 Q 支持度高于或等于阈值minsup的项集 2.3.12.3.1 为什么要使用支持度?支持 度是一种重要的度量,因为支持 度很低的规则只是偶然出现,从 商业角度来看,低支持度的规则 多半也不是令人感兴趣的,因为 对顾客很少同时购买的商品进行 促销可能并无益处。 6 7 一些基本定义 Example: l关联规则 Q形如X Y的蕴涵式,其中X 和Y 是项集。 Q例如: Milk, Diaper Bee
6、r l关联规则强度的衡量指标 Q支持度(缩写:s) 同时包含X和Y的事务比例 Q置信度(缩写:c) Y 在包含X 的事务中出现 的频繁程度。 2.3.12.3.1 7 8 怎样进行关联规则挖掘 l给定事务集T, 关联规则挖掘的任务就 是寻找满足以下条件的关联规则。 Q支持度 minsup threshold Q置信度 minconf threshold l一种“原始野蛮”的方法: Q列出所有的规则 Q分别计算每条规则的置信度和支持度 Q剔除未达到 minsup阈值和 minconf阈值的规则 Computationally prohibitive! 2.3.22.3.2 整体上是经常出现的,整
7、体上是经常出现的, 相互的关联度是大的相互的关联度是大的 8 9 怎样进行关联规则挖掘 Example of Rules: Milk,Diaper Beer (s=0.4, c=0.67) Milk,Beer Diaper (s=0.4, c=1.0) Diaper,Beer Milk (s=0.4, c=0.67) Beer Milk,Diaper (s=0.4, c=0.67) Diaper Milk,Beer (s=0.4, c=0.5) Milk Diaper,Beer (s=0.4, c=0.5) Observations: 所有上述规则都是产生于以下项集: Milk, Diaper
8、, Beer 产生于相同项集的规则具有相同的支持度但是不同的置信度。 因此需要区分开置信度和支持度的要求。 2.3.22.3.2 9 10 怎样进行关联规则挖掘 l采用“两步走”的方法: 1. 先产生频繁项集 即找出 support minsup的所有项集 1. 生成规则 从频繁项集中产生具有高置信度的规则,每条规则 本质上其实就是频繁项集的一个划分。 l产生频繁项集的过程运算量仍然是非常大的! 2.3.22.3.2 10 11 给定d 个项,则可以产 生 2d 个候选项集。 怎样进行关联规则挖掘 2.3.22.3.2 生成频繁项集生成频繁项集 格结构:常常格结构:常常 用来枚举所有用来枚举所
9、有 可能的项集可能的项集 11 12 l原始的方法: Q列出所有可能项集(如右图),即候选的频繁项集 Q扫描事务数据库(左图),计算每个候选项集的支持度。 Q将每个事务与候选项集相匹配,生成关联规则。 Q算法复杂度 O(NMw) = Expensive since M = 2d ! 2.3.22.3.2 怎样进行关联规则挖掘 12 13 算法复杂度 l给定 d 个事务项: Q项集的总数= 2d Q可以生成的规则总数是: If d=6, R = 602 rules 2.3.22.3.2 蕴含式的 左端 蕴含式的 右端 13 14 如何降低产生频繁项集的计算复杂度 l减少候选项集的数目 (M) Q
10、完全的搜索: M=2d Q可以采用一些剪枝的方法减少 M l减少比较次数 (NM) Q可以使用更高级的数据结构存储事务或候选项集 (Hash Tree) Q有些事务和候选项集并不一定需要进行比较。 l减少事务数目 (N) 2.3.22.3.2 14 15 减少候选项集的策略 l先验原理: Q 如果一个项集是频繁的, 则它的所有子集也一定是 频繁的。即: l先验原理成立是因为支持度具 有以下特性: Q 一个项集的支持度决不会 超过其子集的支持度。 Q 这个性质也称为支持度度 量的反单调性。 2.3.22.3.2 15 16 Found to be Infrequent 先验原理应用示例 Prun
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数控车床 复合 循环 指令 编程 ppt 课件