MOOC 数据仓库与数据挖掘-北京理工大学 中国大学慕课答案.docx
《MOOC 数据仓库与数据挖掘-北京理工大学 中国大学慕课答案.docx》由会员分享,可在线阅读,更多相关《MOOC 数据仓库与数据挖掘-北京理工大学 中国大学慕课答案.docx(15页珍藏版)》请在文库网上搜索。
1、 MOOC 数据仓库与数据挖掘-北京理工大学 中国大学慕课答案Test 11、问题:某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?选项:A、关联规则发现B、聚类C、分类D、自然语言处理正确答案:【关联规则发现】2、问题:当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?选项:A、分类B、聚类C、关联分析D、异常检测正确答案:【聚类】3、问题:判断以下行为是否属于数据挖掘任务:根据顾客的职业将顾客进行分组选项:A、正确B、错误正确答案:【错误】4、问题:判断以下行为是否属于数据挖掘任务:根据顾客的购物记录预测顾客感兴
2、趣的商品选项:A、正确B、错误正确答案:【正确】5、问题:判断以下行为是否属于数据挖掘任务:监测患者的心率是否异常选项:A、正确B、错误正确答案:【正确】 6、问题:判断以下行为是否属于数据挖掘任务:提取声波的频率选项:A、正确B、错误正确答案:【错误】7、问题:判断以下行为是否属于数据挖掘任务:预测掷骰子的结果选项:A、正确B、错误正确答案:【错误】8、填空题:数据挖掘是从大量数据中挖掘重要、隐含的、以前未知、_的模式或知识。正确答案:【潜在有用】9、填空题:从数据仓库的角度可以将数据挖掘过程划分为数据清理、数据集成、数据选择与变换、数据挖掘及_等阶段。正确答案:【知识评估】10、填空题:数
3、据挖掘任务主要包括描述性和_任务正确答案:【预测性】Test 21、问题:age 值(以递增序)为:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。使用z-score 规范化将 age 值 35 变换到0.0,1.0区间,变换后的值为()选项:A、0.4B、0.1C、0.9D、0.3正确答案:【0.4】2、问题:一所大学内的各年纪人数分别为:一年级 200 人,二年级 160 人,三年级 130 人,四年级 110 人。则年级属性的众数是:()选项:A、一年级B、二年级C、三年级
4、D、四年级正确答案:【一年级】3、问题:假设属性 income 的最大最小值分别是 12000 元和 98000 元。利用最大最小规范化的方法将属性的值映射到 0 至 1 的范围内。对属性 income 的 73600 元将被转化为:()选项:A、0.821B、1.224C、1.458D、0.716正确答案:【0.716】4、问题:属性 Hair_color = auburn, black, blond, brown, grey, red, white,该属性属于()类型选项:A、标称B、二分C、序数D、数值正确答案:【标称】5、问题:下面不属于数据集特征的是()选项:A、连续性B、维度C、稀
5、疏性D、分辨率正确答案:【连续性】6、填空题:一个数据集的分布的五数概括由最小值、第一个四分位数、_、第三个四分位数、和最大值构成。正确答案:【中位数】7、填空题:定用于分析的数据包含属性 age。age 值(以递增序)为:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。则数据的第一个四分位数的值为_,第三个四分位数的值为 35正确答案:【20】8、填空题:考虑值集12 24 33 24 55 68 26,其四分位数极差是:_正确答案:【31】 9、填空题:数据集的属性可以划分为_
6、和连续型两种。正确答案:【离散型】10、填空题:两个向量 d1 =(1,1,2,1,1,1,0,0,0) d2 = (1,1,1,0,1,1,1,1,1)的余弦相似度为()正确答案:【0.8,0.83】Test 31、问题:假设 12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72,92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15 在第几个箱子内?()选项:A、第一个B、第二个C、第三个D、第四个正确答案:【第二个】2、问题:以下哪种方法不是常用的数据约减方法()选项:A、抽样B、回归C、聚类D、关联规则挖掘
7、正确答案:【关联规则挖掘】3、问题:假定用于分析的数据包含属性 age。数据元组中 age 的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为 3。第二个箱子值为:()选项:A、18.3B、22.6C、26.8D、27.9正确答案:【18.3】4、问题:主成分分析法是一种有参的数据约减方法选项:A、正确 B、错误正确答案:【正确】5、问题:离散属性总是具有有限个值。选项:A、正确B、错误正确答案:【错误】6、问题:特征提
8、取技术并不依赖于特定的领域。选项:A、正确B、错误正确答案:【错误】7、问题:可以通过创造新的属性并加入到现有属性集中实现更有效的挖掘选项:A、正确B、错误正确答案:【正确】8、问题:通过离散化操作可以将连续属性转化为序数属性选项:A、正确B、错误正确答案:【正确】9、问题:通过数据集成可以维护数据源整体上的数据一致性选项:A、正确B、错误正确答案:【正确】10、问题:可以将异常视为缺失值,利用缺失值处理的方法处理也可以用前后俩个观测值的平均值修正该异常值选项:A、正确B、错误正确答案:【正确】Test 4 1、问题:考虑下面的频繁 3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,
9、4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有 5 个项,采用合并策略,由候选产生过程得到 4-项集不包含()选项:A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,5正确答案:【1,2,4,5】2、问题:设 X=1,2,3是频繁项集,则可由 X 产生()个关联规则。选项:A、4B、5C、6D、7正确答案:【6】3、问题:下面购物篮能够提取的 3-项集的最大数量是多少()ID 购买项 1 牛奶,啤酒,尿布 2 面包,黄油,牛奶 3 牛奶,尿布,饼干 4 面包,黄油,饼干 5 啤酒,饼干,尿布 6 牛奶,尿布,面包,黄油 7 面包,黄油,尿布 8 啤酒,尿
10、布 9 牛奶,尿布,面包,黄油 10 啤酒,饼干选项:A、1B、2C、3D、4正确答案:【3】4、问题:Apriori 算法的计算复杂度受()影响。选项:A、支持度阀值B、项数(维度)C、事务数D、事务平均宽度正确答案:【支持度阀值#项数(维度)#事务数#事务平均宽度】5、问题:非频繁模式()选项:A、其支持度小于阈值B、都是不让人感兴趣的C、包含负模式和负相关模式 D、对异常数据项敏感正确答案:【其支持度小于阈值#对异常数据项敏感】6、问题:利用 Apriori 算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于 3 的候选 3-项集,在候选 2-项集中需要
11、剪枝的是()ID 购买项 1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3 牛奶、尿布、啤酒、可乐 4 面包、牛奶、尿布、啤酒 5 面包、牛奶、尿布、可乐选项:A、啤酒、尿布B、啤酒、面包C、面包、尿布D、啤酒、牛奶正确答案:【啤酒、面包#啤酒、牛奶】7、问题:下表是一个购物篮,假定支持度阈值为 40%,其中()是频繁闭项集。TID 项 1abc2abcd3bce4acde5de选项:A、abcB、adC、cdD、de正确答案:【abc#de】8、问题:关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。选项:A、正确B、错误正确答案:【错误】9、问题:具有较高的支持度的项集具有较高的置信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MOOC 中国大学慕课答案