缘起
标题含义:传统行业的三年管培后,2014.12转型做数据,先后经历艾瑞、携程,于2017.9入职eleme的新零售事业的P7数据分析师。从当初的降薪转型到现在的P7职位(待遇接近阿里P7),希望把自己的经历写出来,记录思考过程,也供大家参考。
为什么要从别人的经历里面学习:有没有发现智慧著作很多是伟人言行和经历的记录?《论语》是记录孔子及其弟子言行的书,佛学中的“经”都是记录释迦牟尼故事和言行的书(除了《六祖坛经》是记录慧能的言行),《穷查理宝典》是记录查理芒格的言行的书,以及很多名人传记。代入场景来体会他们的所思所想,从言行中来体验/总结智慧/规律,再用于自己的现实问题。我把自己的经历写出来,希望就这个场景(零经验转行数据)下的问题,提出我的方案和结果。
谁也不能教会谁任何东西。
–美国教育家. 卡尔.罗杰斯
后发优劣:我的经历是“零经验转行数据”的一个非常有力的实证,当能看懂我做的事情以及各阶段的想法,重新走这条路的时候,你应该比我进步快很多(后发优势),两年或者一年半到P7。但就像美国教育家卡尔罗杰斯所说“谁也不能教会谁任何东西”,这些东西如果理解之后不去使用,我多说无益,你理解并做了多少才是你自己的。
与艾瑞结缘
当初怀着不做一眼能看到20年后样子的技术性工作,从上海交大双控研究生毕业之后进入一家民营企业,轮岗于战略/品牌/渠道管理,发现这样的生活不是我所想要的,偶然的机会接触数据,从本来没有价值的数据里面找到些价值(find value out of nowhere),于是开启了「数据自由之路」 。
第一份数据工作在艾瑞咨询,因为前同事的引荐而获得面试机会,面试官正好也是从业务转型数据,他希望我能够带来一些业务导向的数据思维,接受我降薪进入。(对于我第一次转型,只会用excel来处理分区域分产品的销售数据,而后一年我开始在工作中学习sql / python / tableau / omniture等工具。所以我直到现在都认为,工具是最容易学习的,最重要的是你对数据的兴趣和理想/信念带来的坚持不懈。
艾瑞的工作内容:
- 传统行业的营销/广告投放策略:比如传统品牌方A有一笔广告预算,拿出B%给艾瑞做咨询,了解目标用户在电商下单之前的行为特征,哪些环节可以明显影响用户的购买行为?是电商加车的侧边低价,还是垂直内容网站的软文?通过全网用户行为路径分析、商品交叉关联分析、用户画像、广告价值分析、搜索关键字分析、转化漏斗分析等等来推荐广告投放策略,最终用户可能花费50%的预算来达到之前100%的投放效果,因为精准地理解用户。
- 网站数据分析服务:利用 omniture 或 GA 给用户提供网站分析解决方案,从埋点方案设计、观测指标选取、报表设计搭建以及后续问题定位及处理的全套服务。
- 报表整合服务:主要基于tableau/永洪的报表工具,对于甲方(主要是集团客户)散落各处的数据进行整理并做可视化展现,不同层级的查看权限管理等。
在艾瑞的工具使用:
- sqlserver:数据的存放、提取与分析工具,主要在项目中使用,同时涉及存储过程。
- python:用于网页爬虫和解析,分词的处理等。
- Tableau:报表整合服务。
- Omniture:网站在线分析工具。
(相关文章,请参考:《月薪20K的数据分析师都在做什么?》)
艾瑞的工作收获:一年时间,主要是通过项目来磨练工具使用熟练度,对于数据分析有初步的认识;但是从数据分析解决问题的角度来讲,基于乙方提出解决方案,可能很难测量落地后的效果及反馈改进,缺少验证导致继续进步找不到方向。所以希望进入一家甲方公司,来实际见证数据到底对产品迭代能够产生多大的作用?到底能从数据中赚多少钱?有数据和没有数据有什么区别?
思考如何做好数据分析师:在这期间,我一直探索如何成为合格的数据分析师的方法,偶然发现拉勾网的JD可以用来找到端倪、解决一系列问题,比如区分初级和高级的数据分析师的标准是什么?工作年限和薪资的关系是什么?基于这样的困惑,我索性把拉勾的“数据分析”相关信息都爬取下来,写成文章在知乎上分享给同样思考的人,案例有力地证明了我主动用数据解决问题的意识。
(相关文章,请参考:《从拉勾网看数据分析师如何变得值钱?》)
加入携程
如愿进入携程机票产品部做数据分析工作:
我本着见证数据推动产品迭代的目的进入携程机票,但当时状况是前台产品部门对于数据的认可非常低。因为各种原因,导致数据的获取效率低下,从各个渠道拿到同维度指标结果不一致,大家宁愿拍脑袋做决定。我入职后第一件事,验证各个来源,包括不同部门写的在不同平台上(sqlserver/hive)的sql,我都会跑一遍,找到数据差异的原因。
先将信任感建立在我个人身上,只要是我出具的结果,我能告诉你为什么这个数据跟其他人给你的不一致,为什么我取的数据更贴近业务逻辑。再通过对我的信任转移到对数据的信任,开展针对PM的培训,包含对报表/指标的理解和使用、ABTest的分析常用方法、SQL语法以及报表制作,让他们建立数据的自信以及提升数据的使用效率。有效帮助PM实现提出假设、验证假设的分析闭环。
(这段经历,请参考2016年总结:《给30个PM拉了一年Sql,我学到了什么?》)
常规业务分析的瓶颈:
2017上半年,我发现日常的数据分析对产品迭代的必要性,但这适合产品经理来做。因为在提出假设和验证假设的两步骤分析中,提出假设是关键,而sql只是验证假设的很小的一步(是一个工具),提出假设是基于业务意识和数据意识基础上的综合实力。我在2016年补足了PM的sql技能之后,完成他们的分析闭环,使其胜任日常的分析工作。
我认为,被动接受需求并没有完全发挥数据分析师的能量,主动从数据中找出可以迭代的方向,才是数据分析师真正的价值。经过半年的整体梳理及不断breakdown,发生的几个案例让我明白,能把推动产品迭代这件事情做绝的人,不是具备产品意识的数据分析师,而是具备数据意识的产品经理,因为这件事情最重要是用户心理的把握、交互的理解,以及对整个流程的把控等PM的核心领域。
(关于这段经历,请参考《当谈到携程机票产品经理的数据意识,我们在谈什么?》)
携手eleme
我现在传统的业务分析上瓶颈非常明显,希望借助算法来突破。在业务规则限制较少的场景下借助算法来探索解决问题的方法。经过双向选择后,我加入饿了么新零售的数据分析团队,在多sku多用户的场景下去解决复杂的业务问题。
(关于offer获取,请参考《P7数据分析的offer,你准备好了吗?》)
业务分析转型算法的考量:
- feature特征工程:找feature的过程,算法的一个非常重要的部分是找feature以及特征工程。很像业务分析中的发现问题来找原因,比如说最近CR的下降,从节假日因素、PPC投放因素、发布日期因素等等排查;而我们做二分类预测的时候,也是根据这些因素(feature)来判断,只不过人脑可能只会同时纳入3-4个因素来计算影响,而机器可以同时N个因素考虑。
- 工业领域应用的算法都可以被学会。学术领域层出不穷的新方法和非常多的数学公式可能会吓跑很多想学算法的人,但其实工业领域普遍应用的算法还是通用算法(最近深度学习会加深难度),大部分情况下不会用到从paper公式来写算法(不过现在有越来越复杂的趋势)。“十大主流算法”能够理解原理、每个参数代表什么意思,算法在主流场景中的应用效果,在kaggle上进行验证效果,这可能是转算法的一条可以践行的路。
后记
这些是我到P7之前所走过的道路,不一定是全局最优,只是尽量在找发展的梯度方向。至少现在回过头来看,走的弯路在可接受的范围之内。我像一个被蒙上眼睛行走在黑暗的人,没有人告诉我未来的路要怎么走,“闪电之下我无处可躲”(成吉思汗语,取自电影《蒙古王》),我只有主动去思考怎么走才不会掉坑里(“我知道自己未来会死在哪里,我就绝对不会去那里”–查理芒格),借助从数据找价值的信念、以及带来的坚持,亦步亦趋。希望对正在路上的童靴,有一些帮助,抛砖引玉,激发对于未来的思考。
转载自36大数据(36dsj.com)