学习总结
l工作方式与时间安排
研发型的工作:这类工作一般分为:理论方法确定,算法coding,测试&调整改进
1.理论的算法设计
u尽可能多的进入细节部分,想到每一个细节可能出现的问题,和大家一起解决;
u这个阶段一定要产出一份算法设计文档,可以只是纸质的,最关键的是把所有的逻辑和细节处理都呈现出来;
u对于初步确定好的算法,要写成文档发给RD最高负责人做确定把关,负责人确认通过了以后再动手coding。
这次打标签的程序设计做了非常久,最大的问题就是没有开会一起确定最后的方案,以至于后期发现的时候已经非常晚了,东西又要重做。
2.Coding
u模块化,函数化;让自己的所有东西都可以最大化的重复利用,每一个环节都尽量设计成函数的型式;
u遇到问题要问可能懂的人,自己想的方法可能并不是很好【比如这次薛天帮助我改进算法的时间耗时久问题,nico帮我改进循环中的条件不满足就跳过问题】
u对遇到过的报错,要从长远的角度解决,列出所有错误清单,从源头解决,而不是简单的改一改【在过程中最头疼的问题是csv中的科学计数法格式问题,使得ID信息全部丢失】
3.测试
u时间要充足:假设编程编程编程时间需要1天,那么测试时间则需要3天(包括测试过程中的代码方法调整),很多问题都是在测试的时候来的,所以一定要尽早进入测试阶段;
u测试的时候,需要尽可能多的数据环境,【比如这次的方法在做女装品类的时候就完成没问题,但是进入到童装品类,多了大童小童,男童女童,很多地方就要调整】,从紧急的数据开始测起;
l分工方面与工作的安排
这次的项目几乎是我自己从头做到尾,从算法的设计到实施,最后的项目应用,使得自己非常累,而且精力有限的话,效率低,易出错。团队行动才能更好的高效完成一些工作。
u借助每一个人的智慧,和每一个人一起成长,鼓励多思考,而非机械执行,对于劳动密集型工作,鼓励尽可能用程序解决
u每一天都要和团队成员一起碰一碰,看看进度,发现过程中的问题
u年度规划产品的功能其实可以拆解成多个同时并行的任务一起进行,能及早完成的要先完成,对于最难的部分慢慢啃【以往认为只要把最难部分做完后面就很好做的思路会造成后期压力过大】
l实际产品方法流程改进方面
1.数据质量把控要加强,避免后期的分析工作的很多麻烦;很多数据需要前期的清洗,做完后在放入数据库。清洗数据一份,原始数据一份。清洗的内容包括
1)串列的数据做还原
2)价格异常值处理【0元或极大值】
3)商品详情抓取不完全,需要补数据【如童装的外套,其他品类需要进一步排查】
4)大童小童的提取方法确定后,尽快区别大小童数据,对数据直接加入一个区别大小童的列。
2.词库的结构方法层次,以及准确性,可用性
1)童装的词库比较混乱,结构不清晰
2)有少量的准确性问题【比如“常规”,在很多维度里都出现】
3)对于最终用大维度,还是小维度,还得进一步确定【风格、颜色的归纳】
3.打标签的方法
1)算法逻辑的确定,需要以文档形式呈现
2)打标签的速度需要改进提升
4.年度规划中还有很多数据结果的计算可以程序化
1)价格段列表的展现形式可以直接合并成客户要的形式
2)实力与空间指标的计算【主要价格段的市场/品牌销售额】;
3)主打季度的支持数据计算
4)另外对于品类的策略,主打季节规则,主打异位/同位/同类的规则需要进一步一起商议确定,才能程序化。