文库网
ImageVerifierCode 换一换
首页 文库网 > 资源分类 > PDF文档下载
分享到微信 分享到微博 分享到QQ空间

超大规模数据挖掘架构及方法论.pdf

  • 资源ID:9608       资源大小:1.18MB        全文页数:26页
  • 资源格式: PDF       下载:注册后免费下载
微信登录下载
快捷下载 游客一键下载
账号登录下载
三方登录下载: QQ登录 微博登录
二维码
扫码关注公众号登录
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
验证码:   换一换

加入VIP,免费下载
 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

超大规模数据挖掘架构及方法论.pdf

1、更深入地洞察更科学地决策Copyright 2007, Geni-sage Technology CO.,LTD. All rights reserved超大规模数据挖掘架构及方法论Further Insight,Better DecisionsCopyright 2007, Geni-sage Technology CO.,LTD. All rights reserved2议题 超大规模数据挖掘架构主流并行计算架构 数据挖掘并行特点 GDM并行架构 数据分析方法论Further Insight,Better DecisionsCopyright 2007, Geni-sage Technol

2、ogy CO.,LTD. All rights reserved3议题 超大规模数据挖掘架构主流并行计算架构 数据挖掘并行特点 GDM并行架构 数据分析方法论Further Insight,Better DecisionsCopyright 2007, Geni-sage Technology CO.,LTD. All rights reservedMPI4设计目标(1)设计一套应用程序接口,使编程者不需要面对编译器、操作系统执行包。(2)允许高效通信:避免内存到内存的拷贝( memory-to-memory copying),允许 overlap计算和通信,任务分解到各线程。(3)支持异构环

3、境。(4)采取可靠的通信接口:编程者不用应对通信失败。(5)支持多用户平台,而不需要明显的程序修改。(6)线程安全。缺点:串行代码 cpu、内存资源重复占用;Further Insight,Better DecisionsCopyright 2007, Geni-sage Technology CO.,LTD. All rights reserved5MPI_INIT: 启动 MPI环境MPI_COMM_SIZE: 确定进程数MPI_COMM_RANK: 确定自己的进程标识符MPI_SEND: 发送一条消息MPI_RECV: 接收一条消息MPI_FINALIZE: 结束 MPI环境 MPI基本

4、函数Further Insight,Better DecisionsCopyright 2007, Geni-sage Technology CO.,LTD. All rights reserved4 种消息 传递函数 阻塞发送 MP I_ Send (buf fer ,cou nt ,t ype,dest,t ag,co mm ) 非阻塞发送 MP I_ Isend (b uf fer ,cou nt ,t ype,dest,t ag,co mm ,r equ est) 阻塞接收 MP I_ Rec v( bu f fer ,cou nt ,t ype,sou rce,tag,co mm ,

5、 status) 非阻塞接收 MP I_ Irecv(b uf fer ,cou nt ,t ype,sou rce,tag,co mm ,r equ es t) 点对点通信4种通信模式标准通信模式 (MPI_SEND)缓存通信模式 (MPI_BSEND)同步通信模式 (MPI_SSEND)就绪通信模式 (MPI_RSEND)Further Insight,Better DecisionsCopyright 2007, Geni-sage Technology CO.,LTD. All rights reserved通信 :MPI_Bcast(广播 )MPI_Scatter(发布 )MPI_G

6、ather(搜集 )同步: MPI_Barrier规约: MPI_Reduce 集合通信Further Insight,Better DecisionsCopyright 2007, Geni-sage Technology CO.,LTD. All rights reservedOpenMPI8设计目标(1)提供一个标准 的共享内存并行 架构。(2)建立一个简单的标示符集合,使得通过 3、 4个标示符就可以将程序并行化。(3)能够同时提供粗粒度和细粒度并行。(4)不需要编程人员学习消息通信包和撰写底层消息通信代码。编程 及执行 流程(1)基于 OpenMPI思想 编写并行程序;(2)利用 O

7、penMPI编译器 执行并行程序,生成多线程程序(包含线程、共享变量、子线程变量、barriers等);(3)在多核计算机 上执行编译后的并行程序。 支持 for循环和 sections并行缺点:(1)需要预编译并行程序,流程复杂;(2)编译后的并行代码可读性较差。Further Insight,Better DecisionsCopyright 2007, Geni-sage Technology CO.,LTD. All rights reserved其它并行计算思想或平台缺点 Map-Reduce( Fork/Join)需要对程序进行 map、 reduce设计,对串行代码调整较大;由于是分布式并行,因此仅适合比较容易 map、 reduce设计的场景,适用算法有限。 Terracotta集群平台虚拟机层面并行,基本无需调整串行代码,但调度和负载均衡机制考虑较少。9Further Insight,Better DecisionsCopyright 2007, Geni-sage Technology CO.,LTD. All rights reserved10议题 超大规模数据挖掘架构主流并行计算架构 数据挖掘并行特点 GDM并行架构 数据分析方法论


注意事项

本文(超大规模数据挖掘架构及方法论.pdf)为本站会员(李静文)主动上传,文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文库网(点击联系客服),我们立即给予删除!




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

文库网用户QQ群:731843829  微博官方号:文库网官方   知乎号:文库网

Copyright© 2025 文库网 wenkunet.com 网站版权所有世界地图

经营许可证编号:粤ICP备2021046453号   营业执照商标

1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png