文库网
ImageVerifierCode 换一换
首页 文库网 > 资源分类 > PPTX文档下载
分享到微信 分享到微博 分享到QQ空间

人工智能导论PPT第三章机器学习.pptx

  • 资源ID:20014189       资源大小:1.86MB        全文页数:32页
  • 资源格式: PPTX        下载积分:10文币
微信登录下载
快捷下载 游客一键下载
账号登录下载
三方登录下载: QQ登录 微博登录
二维码
扫码关注公众号登录
下载资源需要10文币
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

人工智能导论PPT第三章机器学习.pptx

1、机器学习概述 n“A program can be said to learn from experience E with respect to some class of tasks T and performance measure P,if its performance at tasks in T,as measured bt P,improves with experience E.”n“如果一个程序在使用既有的经验(E)执行某类任务(T)的过程中被认定为是具备学习能力的,那么它一定需要展现出:利用现有的经验(E),不断改善其完成既定任务(T)的性能(P)的特质”n机器学习横跨计算

2、机科学,工程技术和统计学等多个学科,需要多学科的专业知识。,它可以作为实际工具应用于从政治到地质学的多个领域,解决其中的很多问题。甚至可以这么说,机器学习对于任何需要解释并操作数据的领域都有所裨益。机器学习工作流程无监督学习数据预处理与特征工程n数据清洗数据清洗n数据变换数据变换n数据过滤数据过滤n特征工程特征工程 sklearn库简介nScikit-learn库,由David Cournapeau在2007年首次开发。它包含一系列容易实现和调整的有用算法,可以用来实现分类和其他机器学习的任务。在官网下载时只有Scikit-learn,但是在Python调用该库时写法为sklearn,后面在代

3、码中调用该库也均为sklearn,这里可以将sklearn看作是Scikit-learn的缩写。nsklearn的基本功能主要分为六大部分,包括数据预处理、数据降维、模型选择、分类、回归、聚类。基本功能基本功能说明说明数据预处理数据预处理(preprocessingpreprocessing)数据特征提取、归一化。数据降维数据降维(dimensionality dimensionality reductionreduction)主成分分析(PCA)、非负矩阵分解(NMF)、特征选择(eature_selection)等模型选择模型选择(model selectionmodel selectio

4、n)pipeline(流水线)、grid_search(网格搜索)、cross_validation(交叉验证)、metrics(度量)、learning_curve(学习曲线)等分类分类(classificationclassification)逻辑回归、支持向量机(SVM)、K-近邻、随机森林、逻辑回归、神经网络等回归回归(regressionregression)线性回归、支持向量回归(SVR)、脊回归、弹性回归、贝叶斯回归、Lasso回归、最小角回归(LARS)等聚类聚类(clusteringclustering)K-Means(均值聚类)、spectral clustering(谱聚

5、类)、mean-shift(均值漂移)、分层聚类、DBSCAN聚类1.1.选择数据集数据集名称数据集名称调用方式调用方式数据描述数据描述鸢尾花数据集鸢尾花数据集load_iris()用于分类任务的数据集手写数字数据集手写数字数据集load_digits()用于分类任务或者降维任务的数据集乳腺癌数据集乳腺癌数据集load-barest-cancer()简单经典的用于二分类任务的数据集糖尿病数据集糖尿病数据集load-diabetes()经典的用于回归任务的数据集波士顿房价数据波士顿房价数据集集load-boston()经典的用于回归任务的数据集体能训练数据集体能训练数据集 load-linner

6、ud()经典的用于多变量回归任务的数据集2.2.调用数据集调用数据集1.from sklearn.datasets import load_iris2.iris=load_iris()3.3.划分数据集划分数据集n一般会把数据集划分成训练集、验证集和测试集,其中训练集用来估计模型,验证集用来确定网络结构或控制模型复杂程度的参数,而测试集则用于检验最终选择的最优模型的性能优劣。nScikit-learn中使用sklearn.model_selection模块对数据集进行划分,而该模块中的train_test_split()是交叉验证中常用的函数,其功能是从样本中随机按比例选取train_data

7、和test_data4.4.数据预处理数据预处理n归一化:将输入变量变换到某一范围,如01区间。在Scikit-learn库中,使用 MinMaxScaler 类实现;n标准化:通常适用于高斯分布的输入变量。在Scikit-learn库中,使用 StandardScaler 类实现;常用于假定输入变量高斯分布的线性回归、逻辑回归和线性判决分析。n正规化:将输入变量变换为具有单位范数长度的数据。常用的范数有L1、L2。在Scikit-learn库中,使用Normalizer类实现;代码分析 3.35 5数据降维数据降维n数据降维数据降维是指使用主成分分析、非负矩阵分解或特征选择等降维技术来减少要考虑的随机变量个数,其主要应用场景包括可视化处理和效率提升。n主成分分析PCA简介回归分析动机实例步骤n1.获取数据n2.预处理n3.特征工程n4.学习n5.模型评估模型训练n实例化逻辑回归n逻辑回归是一种分类模型。n应用场景:n广告点击率n是否为垃圾邮件n是否患病n金融诈骗n原理n输入值是什么n如何判断输出输入与激活函数n输入n激活函数如果三分,如何考虑?聚类算法nK-means算法nhttp:/


注意事项

本文(人工智能导论PPT第三章机器学习.pptx)为本站会员(bubibi)主动上传,文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文库网(点击联系客服),我们立即给予删除!




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

文库网用户QQ群:731843829  微博官方号:文库网官方   知乎号:文库网

Copyright© 2025 文库网 wenkunet.com 网站版权所有世界地图

经营许可证编号:粤ICP备2021046453号   营业执照商标

1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png