机器学习入门机器学习入门 (11).pdf
《机器学习入门机器学习入门 (11).pdf》由会员分享,可在线阅读,更多相关《机器学习入门机器学习入门 (11).pdf(13页珍藏版)》请在文库网上搜索。
1、教学目标(1 1)理解)理解“关联关联”的概念及意义;的概念及意义;(2 2)掌握基于关联的)掌握基于关联的ALSALS算法的原理及应用;算法的原理及应用;(3 3)掌握)掌握FPFP算法的原理及应用。算法的原理及应用。目目 录录2ALS算法及应用算法及应用 3FP算法及应用算法及应用1关联的概念及意义关联的概念及意义FP树03FP树的概念FPFP树算法是一种采用频繁模式增长的方法挖掘频繁模式的算法,树算法是一种采用频繁模式增长的方法挖掘频繁模式的算法,该算法需要扫描两次数据集:该算法需要扫描两次数据集:第一次扫描数据集得到一维频繁项集;第一次扫描数据集得到一维频繁项集;第二次扫描数据集是利用
2、一维频繁项集过滤数据集中的非频第二次扫描数据集是利用一维频繁项集过滤数据集中的非频繁项,同时生成繁项,同时生成FPFP树。树。FPFP树树是一棵前缀树,按支持度降序排列,支持度越高的频繁项是一棵前缀树,按支持度降序排列,支持度越高的频繁项离根节点越近,从而使得更多的频繁项可以共享前缀。离根节点越近,从而使得更多的频繁项可以共享前缀。其中,其中,a a,b b,.,p p分别表示客户购买的物品。首先,对该事务型数分别表示客户购买的物品。首先,对该事务型数据库进行一次扫描,计算每一行记录中各种物品的支持度,然后按照据库进行一次扫描,计算每一行记录中各种物品的支持度,然后按照支持度降序排列得到第三列
3、的数据。支持度降序排列得到第三列的数据。构建FP树第一步根节点为根节点为nullnull,不表示任何项。,不表示任何项。第一条记录第一条记录fp 对应于对应于FP-treeFP-tree中的第一条分支中的第一条分支 (f:1)(p:1)1构建FP树第二步第二条记录第二条记录fmFP-treeFP-tree中的第二条分支是中的第二条分支是 (f:2)(m:1)12构建FP树第三步第三条记录第三条记录fbFP-treeFP-tree中的第三条分支是中的第三条分支是 (f:3)(b:1)123构建FP树第四步第四条记录第四条记录cpFP-treeFP-tree中的第四条分支是中的第四条分支是 (c:1)(p:1)1234构建FP树第五步第五条记录第五条记录 fp 这条分支已经有了,就更新相关节这条分支已经有了,就更新相关节点的支持度点的支持度1234更新更新挖掘频繁模式寻找以寻找以p p结尾的节点链:结尾的节点链:(1 1)(f:4)(p:2)记为记为(f:2)(p:2)(2 2)(c:1)(p:1)在数据库中只出现了一次。在数据库中只出现了一次。1234寻找以p结尾的节点链p p的前缀节点链:的前缀节点链:(1 1)(f:2)(m:2)(2 2)(c:1)(b:1)12
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
30 文币 0人已下载
下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习入门机器学习入门 11 机器 学习 入门 11