文库网
ImageVerifierCode 换一换
首页 文库网 > 资源分类 > PPT文档下载
分享到微信 分享到微博 分享到QQ空间

人工智能PPT第2章python数值计算-pandas.ppt

  • 资源ID:18831133       资源大小:438.50KB        全文页数:27页
  • 资源格式: PPT        下载积分:15文币
微信登录下载
快捷下载 游客一键下载
账号登录下载
三方登录下载: QQ登录 微博登录
二维码
扫码关注公众号登录
下载资源需要15文币
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

人工智能PPT第2章python数值计算-pandas.ppt

1、 python python科学计算科学计算 -pandas -pandaspandaspandas是基于是基于NumPy的数据分析工具,官的数据分析工具,官方网址是方网址是http:/pandas.org。pandas提供提供了快速,灵活和富有表现力的数据结构,目了快速,灵活和富有表现力的数据结构,目的是使的是使“关系关系”或或“标记标记”数据的工作既简数据的工作既简单又直观。单又直观。nPandas用于数据清洗,对噪音等数据进用于数据清洗,对噪音等数据进行处理,从而便于机器学习和数据分析。行处理,从而便于机器学习和数据分析。pandaspandas常用常用6个类个类nSeries:基本数据

2、结构,一维标签数组,能够保存任何:基本数据结构,一维标签数组,能够保存任何数据类型数据类型nDataFrame:基本数据结构,一般为二维数组,是一组:基本数据结构,一般为二维数组,是一组有序的列有序的列nIndex:索引对象,负责管理轴标签和其他元数据(比:索引对象,负责管理轴标签和其他元数据(比如轴名称)如轴名称)ngroupby:分组对象,通过传入需要分组的参数实现对:分组对象,通过传入需要分组的参数实现对数据分组数据分组nTimestamp:时间戳对象,表示时间轴上的一个时刻:时间戳对象,表示时间轴上的一个时刻nTimedelta:时间差对象,用来计算两个时间点的差值:时间差对象,用来计

3、算两个时间点的差值Pandas 2个重要个重要类类创建创建Series创建创建Series对象的函数是对象的函数是Series,它的主要参数是,它的主要参数是data和和index,其基本语法格式如下。,其基本语法格式如下。pandas.Series(data=None,index=None,name=None)参数说明如下:参数说明如下:ndata:接收:接收array或或dict。表示接收的数据。默认为。表示接收的数据。默认为None。nindex:接收:接收array或或list。表示索引,它必须与数据长度相同。表示索引,它必须与数据长度相同。默认为默认为None。nname:接收:接收

4、string或或list。表示。表示Series对象的名称。默认为对象的名称。默认为None。通过通过ndarray创建创建Seriesimportpandasaspdimportnumpyasnpprint(通过通过ndarray创建的创建的Series为:为:n,pd.Series(np.arange(5),index=a,b,c,d,e,name=ndarray)通过通过dict创建创建Seriesdict的键(的键(key)作为)作为Series的索引,的索引,dict的值的值(Value)作为)作为Series的值,因此无须传入的值,因此无须传入index参数。通过参数。通过dict

5、创建创建Series对象,代码如下所示:对象,代码如下所示:importpandasaspddict=a:0,b:1,c:5,d:3,e:4print(通过通过dict创建的创建的Series为:为:n,pd.Series(dict)通过通过list创建创建Seriesimportpandasaspdlist1=0,1,5,3,4print(通过通过list创建的创建的Series为:为:n,pd.Series(list1,index=a,b,c,d,e,name=list)Series属性属性Series拥有拥有8个常用属性,如下所示。个常用属性,如下所示。nvalues:以:以ndarra

6、y的格式返回的格式返回Series对象的所有元素对象的所有元素nindex:返回:返回Series对象的索引对象的索引ndtype:返回:返回Series对象的数据类型对象的数据类型nshape:返回:返回Series对象的形状对象的形状nnbytes:返回:返回Series对象的字节数对象的字节数nndim:返回:返回Series对象的维度对象的维度nsize:返回:返回Series对象的个数对象的个数nT:返回:返回Series对象的转置对象的转置访问访问Series的属性的属性importpandasaspdseries1=pd.Series(1,5,3,4)print(series1:

7、nn.format(series1)print(series1.values:n.format(series1.values)#数据数据print(series1.index:n.format(series1.index)#索引索引print(series1.shape:n.format(series1.shape)#形状形状print(series1.ndim:n.format(series1.ndim)#维度维度访问访问Series数据数据通过索引位置访问通过索引位置访问Series的数据与的数据与ndarray相同,相同,importpandasaspdseries5=pd.Series

8、(1,5,3,4,5,6,7,index=C,D,E,F,G,A,B)#通过索引位置访问通过索引位置访问Series数据子集数据子集print(series5位于第位于第1位置的数据为位置的数据为:,series50)#通过索引名称(标签)也可以访问通过索引名称(标签)也可以访问Series数据数据print(Eisn.format(series5E)更新更新Seriesimportpandasaspdseries1=pd.Series(list1,index=a,b,c,d,e,name=list)print(series1:nn.format(series1)#更新元素更新元素series

9、1a=3print(更新后的更新后的Series1为:为:n,series1)追加追加Series和插入单个值和插入单个值importpandasaspdseries1=pd.Series(list1,index=a,b,c,d,e,name=list)print(series1:nn.format(series1)series1=pd.Series(4,5,index=f,g)#追加追加Seriesprint(在在series插入插入series1后为:后为:n,series.append(series1)删除删除Series元素元素importpandasaspdseries=pd.Ser

10、ies(list1,index=a,b,c,d,e,name=list)print(series:nn.format(series)#删除数据删除数据series.drop(e,inplace=True)print(删除索引删除索引e对应数据后的对应数据后的series为:为:n,series)。DataFrameDataFrame是是pandas基本数据结基本数据结构,类似数据库中的表。构,类似数据库中的表。DataFrame既既有行索引,也有列索引,可以看作是有行索引,也有列索引,可以看作是Series组成的组成的dict,每个,每个Series是是DataFrame的一列。的一列。创建创

11、建DataFrameDataFrame函数用于创建函数用于创建DataFrame对象,其基本语法格式如下对象,其基本语法格式如下pandas.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)参数说明如下所示:参数说明如下所示:ndata:接收:接收ndarray、dict、list或或DataFrame。表示输入数据。表示输入数据。默认为默认为None。nindex:接收:接收Index,ndarray。表示索引。默认为。表示索引。默认为None。ncolumns:接收:接收Index,ndarray。表示列标

12、签(列名)。默认为。表示列标签(列名)。默认为None。通过通过dict创建创建DataFrameimportpandasaspddict1=col1:0,1,5,3,4,col5:5,6,7,8,9print(通过通过dict创建的创建的DataFrame为:为:n,pd.DataFrame(dict1,index=a,b,c,d,e)通过通过list创建创建DataFrameimportpandasaspdlist5=0,5,1,6,5,7,3,8,4,9print(通过通过list创建的创建的DataFrame为:为:n,pd.DataFrame(list5,index=a,b,c,d,

13、e,columns=col1,col5)通过通过Series创建创建DataFrameimportpandasaspdnoteSeries=pd.Series(C,D,E,F,G,A,B,index=1,5,3,4,5,6,7)weekdaySeries=pd.Series(Mon,Tue,Wed,Thu,Fri,Sat,Sun,index=1,5,3,4,5,6,7)df4=pd.DataFrame(noteSeries,weekdaySeries)print(df4:nn.format(df4)DataFrame属性属性nvalues:以:以ndarray的格式返回的格式返回DataFra

14、me对象的所有元素对象的所有元素nindex:返回:返回DataFrame对象的对象的Indexncolumns:返回:返回DataFrame对象的列标签对象的列标签ndtypes:返回:返回DataFrame对象的数据类型对象的数据类型naxes:返回:返回DataFrame对象的轴标签对象的轴标签nndim:返回:返回DataFrame对象的轴尺寸数对象的轴尺寸数nsize:返回:返回DataFrame对象的个数对象的个数nshape:返回:返回DataFrame对象的形状对象的形状访问访问DataFrame的属性的属性importpandasaspddf=pd.DataFrame(col

15、1:0,1,5,3,4,col5:5,6,7,8,9,index=a,b,c,d,e)print(DataFrame的的Index为:为:,df.index)print(DataFrame的列标签为:的列标签为:,df.columns)print(DataFrame的轴标签为:的轴标签为:,df.axes)print(DataFrame的维度为:的维度为:,df.ndim)print(DataFrame的形状为:的形状为:,df.shape)访问访问DataFrame首尾数据首尾数据print(默认返回前默认返回前5行数据为:行数据为:n,df.head()print(返回后返回后3行数据为:

16、行数据为:n,df.tail(3)更新更新DataFrameimportpandasaspddf=pd.DataFrame(col1:0,1,5,3,4,col5:5,6,7,8,9,index=a,b,c,d,e)print(DataFrame为:为:n,df)#更新列更新列dfcol1=10,11,15,13,14print(更新列后的更新列后的DataFrame为:为:n,df)插入和删除插入和删除DataFrameimportpandasaspddf3=pd.DataFrame(note:C,D,E,F,G,A,B,weekday:Mon,Tue,Wed,Thu,Fri,Sat,Sun

17、)print(df3:nn.format(df3)df3No.=pd.Series(1,5,3,4,5,6,7)#采用赋值的方法插入列采用赋值的方法插入列print(df3:nn.format(df3)deldf3weekday#删除列的方法有多种,如删除列的方法有多种,如del、pop、dropprint(df3:nn.format(df3)Index创建创建Series或或DataFrame等对象时,索引会被转换为等对象时,索引会被转换为Index对象。对象。Index对象可以通过对象可以通过pandas.Index()函数创建,也可以通过创建数函数创建,也可以通过创建数据对象据对象Ser

18、ies、DataFrame时接收时接收index(或(或column)参数创建,)参数创建,前者属于显式创建,后者属于隐式创建。隐式创建中,通过访问前者属于显式创建,后者属于隐式创建。隐式创建中,通过访问index(或(或DataFrame的的column)属性得到)属性得到Index,Index对象不对象不可修改,保证了可修改,保证了Index对象在各个数据结构之间的安全共享。对象在各个数据结构之间的安全共享。Index对象常用的属性及其说明如下所示。对象常用的属性及其说明如下所示。nis_monotonic:当各元素均大于前一个元素时,返回:当各元素均大于前一个元素时,返回Truenis_unique:当:当Index没有重复值时,返回没有重复值时,返回TrueplotMatplotlib绘制一张图表需要各个基础组件对象,工作量较绘制一张图表需要各个基础组件对象,工作量较大。而大。而pandas中使用行标签和列标签以及分组信息,较为简便的中使用行标签和列标签以及分组信息,较为简便的完成图表的制作。完成图表的制作。


注意事项

本文(人工智能PPT第2章python数值计算-pandas.ppt)为本站会员(bubibi)主动上传,文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文库网(点击联系客服),我们立即给予删除!




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

文库网用户QQ群:731843829  微博官方号:文库网官方   知乎号:文库网

Copyright© 2025 文库网 wenkunet.com 网站版权所有世界地图

经营许可证编号:粤ICP备2021046453号   营业执照商标

1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png