人工智能PPT第2章python数值计算-pandas.ppt

资源ID：18831133 资源大小：438.50KB 全文页数：27页
资源格式： PPT 下载积分：15文币

微信登录下载

快捷下载

账号登录下载

三方登录下载：

扫码关注公众号登录

下载资源需要15文币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

人工智能PPT第2章python数值计算-pandas.ppt

1、 python python科学计算科学计算 -pandas -pandaspandaspandas是基于是基于NumPy的数据分析工具，官的数据分析工具，官方网址是方网址是http:/pandas.org。pandas提供提供了快速，灵活和富有表现力的数据结构，目了快速，灵活和富有表现力的数据结构，目的是使的是使“关系关系”或或“标记标记”数据的工作既简数据的工作既简单又直观。单又直观。nPandas用于数据清洗，对噪音等数据进用于数据清洗，对噪音等数据进行处理，从而便于机器学习和数据分析。行处理，从而便于机器学习和数据分析。pandaspandas常用常用6个类个类nSeries：基本数据

2、结构，一维标签数组，能够保存任何：基本数据结构，一维标签数组，能够保存任何数据类型数据类型nDataFrame：基本数据结构，一般为二维数组，是一组：基本数据结构，一般为二维数组，是一组有序的列有序的列nIndex：索引对象，负责管理轴标签和其他元数据（比：索引对象，负责管理轴标签和其他元数据（比如轴名称）如轴名称）ngroupby：分组对象，通过传入需要分组的参数实现对：分组对象，通过传入需要分组的参数实现对数据分组数据分组nTimestamp：时间戳对象，表示时间轴上的一个时刻：时间戳对象，表示时间轴上的一个时刻nTimedelta：时间差对象，用来计算两个时间点的差值：时间差对象，用来计

3、算两个时间点的差值Pandas 2个重要个重要类类创建创建Series创建创建Series对象的函数是对象的函数是Series，它的主要参数是，它的主要参数是data和和index，其基本语法格式如下。，其基本语法格式如下。pandas.Series(data=None,index=None,name=None)参数说明如下：参数说明如下：ndata：接收：接收array或或dict。表示接收的数据。默认为。表示接收的数据。默认为None。nindex：接收：接收array或或list。表示索引，它必须与数据长度相同。表示索引，它必须与数据长度相同。默认为默认为None。nname：接收：接收

4、string或或list。表示。表示Series对象的名称。默认为对象的名称。默认为None。通过通过ndarray创建创建Seriesimportpandasaspdimportnumpyasnpprint(通过通过ndarray创建的创建的Series为：为：n,pd.Series(np.arange(5),index=a,b,c,d,e,name=ndarray)通过通过dict创建创建Seriesdict的键（的键（key）作为）作为Series的索引，的索引，dict的值的值（Value）作为）作为Series的值，因此无须传入的值，因此无须传入index参数。通过参数。通过dict

5、创建创建Series对象，代码如下所示：对象，代码如下所示：importpandasaspddict=a:0,b:1,c:5,d:3,e:4print(通过通过dict创建的创建的Series为：为：n,pd.Series(dict)通过通过list创建创建Seriesimportpandasaspdlist1=0,1,5,3,4print(通过通过list创建的创建的Series为：为：n,pd.Series(list1,index=a,b,c,d,e,name=list)Series属性属性Series拥有拥有8个常用属性，如下所示。个常用属性，如下所示。nvalues：以：以ndarra

6、y的格式返回的格式返回Series对象的所有元素对象的所有元素nindex：返回：返回Series对象的索引对象的索引ndtype：返回：返回Series对象的数据类型对象的数据类型nshape：返回：返回Series对象的形状对象的形状nnbytes：返回：返回Series对象的字节数对象的字节数nndim：返回：返回Series对象的维度对象的维度nsize：返回：返回Series对象的个数对象的个数nT：返回：返回Series对象的转置对象的转置访问访问Series的属性的属性importpandasaspdseries1=pd.Series(1,5,3,4)print(series1:

7、nn.format(series1)print(series1.values:n.format(series1.values)#数据数据print(series1.index:n.format(series1.index)#索引索引print(series1.shape:n.format(series1.shape)#形状形状print(series1.ndim:n.format(series1.ndim)#维度维度访问访问Series数据数据通过索引位置访问通过索引位置访问Series的数据与的数据与ndarray相同，相同，importpandasaspdseries5=pd.Series

8、(1,5,3,4,5,6,7,index=C,D,E,F,G,A,B)#通过索引位置访问通过索引位置访问Series数据子集数据子集print(series5位于第位于第1位置的数据为位置的数据为:,series50)#通过索引名称（标签）也可以访问通过索引名称（标签）也可以访问Series数据数据print(Eisn.format(series5E)更新更新Seriesimportpandasaspdseries1=pd.Series(list1,index=a,b,c,d,e,name=list)print(series1:nn.format(series1)#更新元素更新元素series

9、1a=3print(更新后的更新后的Series1为：为：n,series1)追加追加Series和插入单个值和插入单个值importpandasaspdseries1=pd.Series(list1,index=a,b,c,d,e,name=list)print(series1:nn.format(series1)series1=pd.Series(4,5,index=f,g)#追加追加Seriesprint(在在series插入插入series1后为：后为：n,series.append(series1)删除删除Series元素元素importpandasaspdseries=pd.Ser

10、ies(list1,index=a,b,c,d,e,name=list)print(series:nn.format(series)#删除数据删除数据series.drop(e,inplace=True)print(删除索引删除索引e对应数据后的对应数据后的series为：为：n,series)。DataFrameDataFrame是是pandas基本数据结基本数据结构，类似数据库中的表。构，类似数据库中的表。DataFrame既既有行索引，也有列索引，可以看作是有行索引，也有列索引，可以看作是Series组成的组成的dict，每个，每个Series是是DataFrame的一列。的一列。创建创

11、建DataFrameDataFrame函数用于创建函数用于创建DataFrame对象，其基本语法格式如下对象，其基本语法格式如下pandas.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)参数说明如下所示：参数说明如下所示：ndata：接收：接收ndarray、dict、list或或DataFrame。表示输入数据。表示输入数据。默认为默认为None。nindex：接收：接收Index，ndarray。表示索引。默认为。表示索引。默认为None。ncolumns：接收：接收Index，ndarray。表示列标

12、签（列名）。默认为。表示列标签（列名）。默认为None。通过通过dict创建创建DataFrameimportpandasaspddict1=col1:0,1,5,3,4,col5:5,6,7,8,9print(通过通过dict创建的创建的DataFrame为：为：n,pd.DataFrame(dict1,index=a,b,c,d,e)通过通过list创建创建DataFrameimportpandasaspdlist5=0,5,1,6,5,7,3,8,4,9print(通过通过list创建的创建的DataFrame为：为：n,pd.DataFrame(list5,index=a,b,c,d,

13、e,columns=col1,col5)通过通过Series创建创建DataFrameimportpandasaspdnoteSeries=pd.Series(C,D,E,F,G,A,B,index=1,5,3,4,5,6,7)weekdaySeries=pd.Series(Mon,Tue,Wed,Thu,Fri,Sat,Sun,index=1,5,3,4,5,6,7)df4=pd.DataFrame(noteSeries,weekdaySeries)print(df4:nn.format(df4)DataFrame属性属性nvalues：以：以ndarray的格式返回的格式返回DataFra

14、me对象的所有元素对象的所有元素nindex：返回：返回DataFrame对象的对象的Indexncolumns：返回：返回DataFrame对象的列标签对象的列标签ndtypes：返回：返回DataFrame对象的数据类型对象的数据类型naxes：返回：返回DataFrame对象的轴标签对象的轴标签nndim：返回：返回DataFrame对象的轴尺寸数对象的轴尺寸数nsize：返回：返回DataFrame对象的个数对象的个数nshape：返回：返回DataFrame对象的形状对象的形状访问访问DataFrame的属性的属性importpandasaspddf=pd.DataFrame(col

15、1:0,1,5,3,4,col5:5,6,7,8,9,index=a,b,c,d,e)print(DataFrame的的Index为：为：,df.index)print(DataFrame的列标签为：的列标签为：,df.columns)print(DataFrame的轴标签为：的轴标签为：,df.axes)print(DataFrame的维度为：的维度为：,df.ndim)print(DataFrame的形状为：的形状为：,df.shape)访问访问DataFrame首尾数据首尾数据print(默认返回前默认返回前5行数据为：行数据为：n,df.head()print(返回后返回后3行数据为：

16、行数据为：n,df.tail(3)更新更新DataFrameimportpandasaspddf=pd.DataFrame(col1:0,1,5,3,4,col5:5,6,7,8,9,index=a,b,c,d,e)print(DataFrame为：为：n,df)#更新列更新列dfcol1=10,11,15,13,14print(更新列后的更新列后的DataFrame为：为：n,df)插入和删除插入和删除DataFrameimportpandasaspddf3=pd.DataFrame(note:C,D,E,F,G,A,B,weekday:Mon,Tue,Wed,Thu,Fri,Sat,Sun

17、)print(df3:nn.format(df3)df3No.=pd.Series(1,5,3,4,5,6,7)#采用赋值的方法插入列采用赋值的方法插入列print(df3:nn.format(df3)deldf3weekday#删除列的方法有多种，如删除列的方法有多种，如del、pop、dropprint(df3:nn.format(df3)Index创建创建Series或或DataFrame等对象时，索引会被转换为等对象时，索引会被转换为Index对象。对象。Index对象可以通过对象可以通过pandas.Index()函数创建，也可以通过创建数函数创建，也可以通过创建数据对象据对象Ser

18、ies、DataFrame时接收时接收index（或（或column）参数创建，）参数创建，前者属于显式创建，后者属于隐式创建。隐式创建中，通过访问前者属于显式创建，后者属于隐式创建。隐式创建中，通过访问index（或（或DataFrame的的column）属性得到）属性得到Index,Index对象不对象不可修改，保证了可修改，保证了Index对象在各个数据结构之间的安全共享。对象在各个数据结构之间的安全共享。Index对象常用的属性及其说明如下所示。对象常用的属性及其说明如下所示。nis_monotonic：当各元素均大于前一个元素时，返回：当各元素均大于前一个元素时，返回Truenis_unique：当：当Index没有重复值时，返回没有重复值时，返回TrueplotMatplotlib绘制一张图表需要各个基础组件对象，工作量较绘制一张图表需要各个基础组件对象，工作量较大。而大。而pandas中使用行标签和列标签以及分组信息，较为简便的中使用行标签和列标签以及分组信息，较为简便的完成图表的制作。完成图表的制作。

注意事项: 本文（人工智能PPT第2章python数值计算-pandas.ppt）为本站会员（bubibi）主动上传，文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知文库网（点击联系客服），我们立即给予删除！