集中趋势于离散趋势
描述集中趋势与离散趋势
pandas实现
平均数处理
price_mean = df[“单价价格(元/平方)”].mean()
中位数 median()
数值法
数值数据分布:直方图体现的是数据在各个区间的分布情况 柱状图体现的是各个数据的变化趋势
直方图的x轴只能是数值型数据 直方图是连续的图像分布 y轴是这一段
直方图是连续的图形分布 y轴是这一段区间内数量的总和 而柱状图是单一的柱形 y轴是这一个值对应的数量
plt.hist(df[“单价价格”])
bins设置区间的数量 设置100个统计区间 区分更细 分布也就更清晰
正态分布是日常生活中最为常见的一种分布状态
他的均值 中位数都相等
右偏态 中位数<均值
左偏态 均值<中位数
离散趋势 方差和标准差
方差.var()
标准差 .std()
标准差和方差能更好的表述哪一个数据集更加集中 更加稳定
四分位 单独的quantile() 获取四分位 pandas的四分位 describe()