目标:利用Tableau搭建好模板后,可以直接出漏斗图,自动计算每个环节的转化率。比如阶段2,3,4相较于阶段1的转化率,或者是每个阶段对于初始阶段的转化率,理想的效果图如下
问题:但根据数据逻辑,在实际操作中,容易出现如下情况,即因为阶段1中,涵盖了阶段2的数量,导致阶段1会自动把阶段2的数量给剔除,数据结果如下图。这就导致所算的转化率不对。我们所期望的,每上一个阶段都要包含下个阶段的内容。
解决办法:通过在数据库中添加修改数据标识列,来调整数据逻辑
利用工具:Python
基本思路:1.对于需要分析的数据,首先添加一列‘订单阶段’用于标记,比如df.insert(1,'订单阶段');2.新建一个Dataframe,根据数据的内容,存放相应的数据,并改变‘标识’中的‘订单阶段’内容,如下
stage4data=stage1data[stage1data['交付状态']=='已交付']
stage4data['订单阶段']='stage4'
3.把所有数据拼接在一起,形成新数据,并导出表
dataall=pd.concat([stage1data,stage2data,stage3data,stage4data],ignore_index=True)
dataall.to_excel('C:\Users\rayyang\Desktop\阶段数据.xlsx',index=False)
利用以上步骤得到的表,导入到Tableau,即可实现正确漏斗图的制作