目录
数据分析——观测、实验、应用
观测
实验
应用
数据分析——观测、实验、应用 观测:通过一些技术手段去获取数据,并对数据进行一定的分析和测量。
目的是对事物形成一种客观量化的认知。简单来讲,就是获取数据来制作报表,图表和仪表盘。
实验:通过不断的提出假设和实践假设,并且基于关键的数字去验证这些假设。
目的是准确得知那些方法可以使事物准确的朝着人为设定的方向发展。实践是当今社会上进行科学研究最有利的武器,一切自然规律的发现都离不开基于数据的分析。
如:在商业场上如果想知道那个商品卖的最好,就把每个版本做一遍然后进行数据分析来观测。例子:A/B测试。
应用:在实际的生产环境使用实验得到的技术方法,基于数据不断提高和迭代。
目的是用实验得到的新方法提高生产力,根据市场反馈来进行更新,然后创作商业价值。
观测 (观察)采集数据、储存数据、展示数据。
(测量)设定标准、发现异常、研究关系。
观测:通过一些技术手段去获取数据,并对数据进行一定的分析和测量。
目的是对事物形成一种客观量化的认知。简单来讲,就是获取数据来制作报表,图表和仪表盘。
实验:通过不断的提出假设和实践假设,并且基于关键的数字去验证这些假设。
目的是准确得知那些方法可以使事物准确的朝着人为设定的方向发展。实践是当今社会上进行科学研究最有利的武器,一切自然规律的发现都离不开基于数据的分析。
如:在商业场上如果想知道那个商品卖的最好,就把每个版本做一遍然后进行数据分析来观测。例子:A/B测试。
应用:在实际的生产环境使用实验得到的技术方法,基于数据不断提高和迭代。
目的是用实验得到的新方法提高生产力,根据市场反馈来进行更新,然后创作商业价值。
(观察)采集数据、储存数据、展示数据。
(测量)设定标准、发现异常、研究关系。
采集数据:
解析系统日志(程序,APP,比如你观看一个视频就会产生日志你打开和关闭的时间,提取信息,解析日志,就可以得到数据。基于运算可以得到新数据。
1.埋点(分析师获取新数据的主要方式,最可靠的方式)获取新数据。还可以自定义日志,得到你想知道的信息。如用户ID,地址等等。
2.通过传感器采集,比如天气数据,(温度湿度天气)或智能手环。
3.爬虫,解析别人呈现数据的网站,将数据复制出来,解析网站--抓取数据。
4.API(Application Programming Interface),按分析师规则来提供数据。
储存数据:
各种类型数据库。【数据工程师】
连接数据库取数
展示数据:
可视化高效传达信息。
这里额外问一下,你觉得分析数据地目的是什么?
分析数据的目的:从商业看:1.及时发现异常2.找到数据之间的因果关系。【提高这个数据指标,另一个指标也会提高】
注意:数据是客观统一的,有统一的认知才能有共同的目标。
设定标准+发现异常:
数据标准(Benchmark)。比如今年销售目标120万,平均每个月10万,那么设定的标准就是10万,那这个数据作为判断标准。如果低于10万,那就是发现异常,可以进行分析异常来提高达到更高的指标(如便利贴的发明)。异常:及时解决+研究形成的原因和机制。异常可能回得到额外的启发。
研究关系:
可视化查看相关性/建模推导相关性。
实验 拆解问题、提出假设、设计实验。
收集数据、分析数据、验证假设。
拆解问题、提出假设、设计实验。
收集数据、分析数据、验证假设。
提出假设,验证假设:
解决问题得唯一方法就是提出一个合理得假设,然后验证假设。比如外卖差评率提高,可以假设是恶劣天气引起,然后验证假设:通过查看天气数据。注意:要通过持续分析,一次次假设都成立。
注意:所有未经实时数据验证得想法都是假设。
设计实验:
如:设计A/B测试获取数据。
随机抽取合适用户,比较每组数据,通过一小部分用户来收集足够数据来得到结果。
全部步骤包含:明确实验目标,确定核心指标,合理提出假设,预估样本数量,预估实验时长,设计开发实验,检查实验数据,设置结束标准,确定优化策略等等。
应用 制定策略、实施策略、反馈迭代。
训练算法、优化算法、使用算法。
制定策略、实施策略、反馈迭代。
训练算法、优化算法、使用算法。
如何应用数据创造价值?
一:基于数据反馈不断迭代产品和业务策略
二:基于数据训练算法,让机器其自动化地完成工作
拆解方法:
流程拆解法,二分法,象限拆解法,杜邦分析法,AARRR,PEST,RFM,SWOT,5W1H.
只要符合MECE法则即可。
重点:明确业务目标
将数据应用于业务 将数据应用于算法 为算法设定明确的业务目标 为算法提供高质量地数据 判断算法是否真的创造了实际价值 帮助业务更好地使用算法
注:本文为学习数据分析第一日学习心得,学习来源:B站戴戴戴师兄