欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

《Python数据分析与应用》第4章Pandas统计分析(1)实训部分

时间:2023-05-24
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分(源于大学课程python数据分析) 实训1 读取并查看P2P网络贷款数据主表的基本信息

1.利用read_csv读取P2P网络贷款数据主表

2.利用ndim属性查看主表维度、利用shape属性查看主表形状、利用memory_usage属性查看主表占用内存信息

3.利用describe方法对主表进行描述性统计分析

4.利用自定义函数剔除值相同或全为空的列,标准差表示的是样本数据的离散程度,标准差为0就是数组为空值,所以求全为空的列就是求标准差为0的列

实训2 提取用户信息更新表和登录信息表的时间信息

1.利用read_csv读取用户信息更新表和登录信息表

2.利用to_datetime函数转换用户信息更新表和登录信息表的时间字符串


3.利用year、month、week等方法提取用户信息更新表和登录信息表中的时间信息

3.1提取用户信息更新表字段为’ListingInfo1’、‘UserupdateInfo2’中的时间信息


3.2提取登录信息表字段为’Listinginfo1’、'LogInfo3’中的时间信息


4.计算用户信息更新表和登录信息表中两时间的差,分别以日、小时、分钟计算
4.1计算用户信息更新表的两时间差
4.1.1以日计算

4.1.2以小时计算

4.1.3以分钟计算

4.2计算用户登录信息表的两时间差
4.2.1以日计算

4.2.2以小时计算

4.2.3以分钟计算

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。