欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

数据分析笔记11

时间:2023-05-24
描述性分析

集中趋势于离散趋势
描述集中趋势与离散趋势
pandas实现
平均数处理
price_mean = df[“单价价格(元/平方)”].mean()
中位数 median()
数值法

图像法

数值数据分布:直方图体现的是数据在各个区间的分布情况 柱状图体现的是各个数据的变化趋势
直方图的x轴只能是数值型数据 直方图是连续的图像分布 y轴是这一段
直方图是连续的图形分布 y轴是这一段区间内数量的总和 而柱状图是单一的柱形 y轴是这一个值对应的数量
plt.hist(df[“单价价格”])
bins设置区间的数量 设置100个统计区间 区分更细 分布也就更清晰
正态分布是日常生活中最为常见的一种分布状态

数值分析

他的均值 中位数都相等
右偏态 中位数<均值
左偏态 均值<中位数
离散趋势 方差和标准差
方差.var()
标准差 .std()
标准差和方差能更好的表述哪一个数据集更加集中 更加稳定
四分位 单独的quantile() 获取四分位 pandas的四分位 describe()

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。