1.利用read_csv读取P2P网络贷款数据主表
2.利用ndim属性查看主表维度、利用shape属性查看主表形状、利用memory_usage属性查看主表占用内存信息
3.利用describe方法对主表进行描述性统计分析
4.利用自定义函数剔除值相同或全为空的列,标准差表示的是样本数据的离散程度,标准差为0就是数组为空值,所以求全为空的列就是求标准差为0的列
1.利用read_csv读取用户信息更新表和登录信息表
2.利用to_datetime函数转换用户信息更新表和登录信息表的时间字符串
3.利用year、month、week等方法提取用户信息更新表和登录信息表中的时间信息
3.1提取用户信息更新表字段为’ListingInfo1’、‘UserupdateInfo2’中的时间信息
3.2提取登录信息表字段为’Listinginfo1’、'LogInfo3’中的时间信息
4.计算用户信息更新表和登录信息表中两时间的差,分别以日、小时、分钟计算
4.1计算用户信息更新表的两时间差
4.1.1以日计算
4.1.2以小时计算
4.1.3以分钟计算
4.2计算用户登录信息表的两时间差
4.2.1以日计算
4.2.2以小时计算
4.2.3以分钟计算