1.将异常值替换为空值,然后删除空值
import pandas as pddata=pd.read_csv('E:\Pylearning\test.csv')print(data)data['价格'][data['价格']>1000]=Noneprint(data.dropna())
2.将异常值替换为空值,然后进行数据插补
data['价格'][data['价格']>1000]=Noneprint(data.fillna(data.mean()))
乱码处理编码格式信息一般在标签中,可以了解后,为相应对象指定这种编码格式
response.encoding='gbk'
也可以直接通过apparent_encoding 属性
response.encoding=response.apparent_encoding
此外,还有一种常见代码是以’u’开头的十六进制字符串,需要通过编码转化的方式解码
str_16_1="b'\u4f60\u597d"print(str_16_1.encode('utf-8').decode('unicode_escape'))