欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

《Python数据分析与应用》第5章使用Pandas进行数据预处理实训部分

时间:2023-05-01
《Python数据分析与应用》第5章使用Pandas进行数据预处理 实训部分(源于大学课程python数据分析) 实训1合并线损、用电量趋势与线路告警数据

1.读取两表
2.查看两表形状

3.以ID和date两个键值作为主键进行内连接


4.查看数据

实训2 插补用户电量数据缺失值

1.读取missing_data.csv表中的数据并将列名进行重命名操作


2.查询缺失值所在位置

3.使用SciPy库中interpolate模块中的lagrange对数据进行拉格朗日插值
data删除缺失值行后数据赋值给data2

生成x列表

分别提取data2中的数据放入y、y1、y2,之后分别与x进行拟合



用拟合函数填补缺失值(A用户缺失行为5,12;B用户缺失行为3.10,19,20;C用户缺失行为4,7,10,16。借此进行填充)


4.查看数据中是否存在缺失值,若不存在则说明插值成功
查看拉格朗日插值后缺失值的位置

查看每一列缺失值个数

实训3 标准化建模专家样本数据

1.读取model.csv数据

2.定义标准差标准化函数


3.使用函数分别对3列数据进行标准化;查看标准化后的数据




Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。