大家好,我是爱学习的小xiong熊妹。
一提起数据分析,很多人都会自然而然联想到Excel,SQL,Python等工具。搞得很多小伙伴深陷书海无法自拔,经常问:到底要学到什么程度,才算能懂呀?
今天先从最简单的Excel讲起吧。
一、.Excel是干啥的?Excel不是数据分析的专用工具。Excel只是一个处理表格的基本工具,除了简单的制作表格以外,基于表格的数据计算、数据图表绘制、统计学/运筹学公式,Excel都有包含。并且,完全不需要写代码就能使用,上手难度极低。
二、 Excel对数据分析有啥用?先问一句:数据分析的工作是啥?
简单来说,有5部分:
存储原始数据
按要求提取数据
按要求计算数据
将数据做成图表
解读数据,得出结论
这五个部分,用Excel都能实现。并且,Excel操作非常简单,因此很适合作为数据新人的启蒙工具。
那么,怎么算懂Excel呢?
三、怎么算懂Excel?理论上,100%搞懂Excel的所有功能是不太可能的,君不见单单讲Excel函数的书都有几百页厚。而且,也没必要100%搞明白,作为一个数据新人启蒙的工具,想搞懂Excel,关键是搞懂四大基础操作。
操作1:建表。没有数据分析习惯的人,在Excel里呈现数据,写的是他最终使用数据的样子。但是这样形式太固化,无法重复使用,因此经常引起反反复复的提数。有数据分析习惯的人,区分维度和指标,可以轻松进行计算,数据操作效率非常高(如下图)。
操作二:清晰指标计算/汇总计算。有数据分析习惯的人,在做Excel的时候,很清楚自己是在计算一个新指标,还是汇总一个旧指标整体数据。这样的习惯,能在计算的时候清晰指标间逻辑关系,不但不容易出错,而且可以基于新衍生的分类标签/指标,做更多分析(如下图)。
操作三:熟练使用数据透视表。数据透视表是Excel数据分析的核心功能,熟练掌握,不但计算速度更快,而且对理解数据聚合的概念有奇效(如下图)。
操作四:根据需求挑选合适的图表。做一张图很容易,但是根据实际需要选择图表,才是数据分析人员的要求(如下图)。
掌握了上边四大操作,就已经能把一个数据萌新与财务、HR区分开。因为此时,你已经不会横着竖着乱摆数据,而是按一定逻辑,规范处理数据。这四大操作,在后续学习SQL,Python等工具的时候,还会遇到。到时候完全可以对照Excel的操作进行理解。
相比之下,Excel有些看似复杂的操作,比如统计学/财务函数,比如线性规划工具箱、统计检验工具,线性回归模型等。虽然背后的原理很复杂,但是操作上都是套公式计算而已,有实际需求的时候再了解即可。为了复杂而复杂,就没必要了。
四、从懂Excel到数据分析单纯懂Excel,还不足以做数据分析。因为现实中的数据分析问题,常常是口语化的,随意的,比如:
“小熊妹,最近的销售情况怎么样?”
“小熊妹,为什么这次活动比上次效果差?”
“小熊妹,预测下下个月业绩有多少?”
Excel里可没有一个按钮能直接点出上边几个问题的答案,需要我们自己转化问题。
常见的需求有三种:
需求一:提供数据。比如“小熊妹,最近的销售情况怎么样?”此时我们应该确认统计数据的分类维度与指标。然后做成Excel示例,让需求方确认格式正确后,再到数据库里提取数据(如下图)。
需求二:对比分析。比如“小熊妹,为什么这次活动比上次效果差?”此时要把下面三个问题讨论清楚,做好Excel示例,再对应提取数据(如下图):
谁和谁进行对比
对比哪些指标
是否要分类
需求三:预测分析。比如“小熊妹,预测一下下个月业绩有多少?”此时需要业务方选择,用业务模型来预测,还是用算法模型预测。如果采用业务模型预测,则需把业务逻辑、假设情况等要素提前在Excel里做好(如下图)。
如果是算法模型,那么简单的时间序列/回归模型,可以直接在Excel里进行计算(如下图)。
当然,复杂的模型,还是上SPSS/Python吧,别难为Excel。
这样转化以后,才能将Excel操作运用到数据分析工作之中。
不过,以上只是简单示例,现实中数据分析问题,可能更复杂。因此也更需要一开始就在Excel里打好样板,让业务方看到输出物的样子,确认符合需求。避免自己埋头苦干,写了几天代码结果被人喷:“你这分析的都是啥呀!”那就太惨了。Excel作为业务和技术人员沟通的桥梁,着实好用。
五、 为什么Excel没有被取代随着数据量增大,存储原始数据的任务一般交给数据库。提取、计算也可以使用Sql、Python等工具完成。因此Excel在今天,用处大大减少。但这仍然不能撼动它的地位。因为它还有三大额外优势:
优势一:能处理各种零散数据。比如调查问卷,比如从公众号、天猫、抖音后台导出的数据,比如外部ppt里附带数据。这些都很难入数据库,可以通过excel统一处理。此时,需要进一步掌握Excel数据清洗的常用函数,比如:concat(链接字符串),replace(替换内容)Vlookup(匹配字段)等等。
优势二:方便业务部门自行计算。很多时候,业务喜欢自己做计算,此时可以把业务想计算的分类维度、指标准备好,然后教业务方使用数据透视表,想计算啥,就计算啥。省的老找我们一遍遍跑数
优势三:做好的图能直接排在PPT里。写报告省事。这个就不都说了。
总之,即使技术再进步,Excel也不会轻易被淘汰的。
作者:小熊妹。公众号:码工小熊。数据界新人,喜欢数据分析、数据挖掘。