首先,最大的恐慌:无法解释的指标波动。其中,由于集群迁移和组件更新等技术变更带来的数据校验最为痛苦——因为业务逻辑和数据方案没有变,任何波动都难...
首先要知道,数据质量问题在一个公司里到底是一个什么层级的问题? 很多对数据部门来说很严重的问题,对其他部门的同事来说,却并不是问题。数据平台的数...
分类逻辑可以分为横向和纵向两种类型。横向分的是层次,纵向分的是主题(或者主体)。这两个方向的分类构成了当前市场上数据仓库的主流分类逻辑。 第一层...
永远要记得一件事:我们不是数据的创造者,用户和业务才是。 1.数据同步和交换 数据同步的方法可以分为: ·API同步 ·文件传输 ·协议传输 A...
无论这些组件的排布方式是什么,数据平台需要解决的问题都是一致的。 ·数据采集:日志采集和数据同步; ·数据清洗和预处理:涉及一系列的规则,本质也...
统计学和因果论:相关性和因果关系 相关性:两个变量的一致性程度。存在3种状态:正相关、负相关、不相关。 相关性代表“有概率存在因果关系”,但是因...
我们回到最早的那个问题,数据产品经理存在的目标是什么?答案之一是为数据使用者提供工具,以提升数据应用于辅助决策的效率。 而数据为业务决策提供辅助...
1.事件 事件可以分成3个大的类型:浏览(View)、行为(Action)和其他(Extra)。浏览又包含页面的浏览和位置曝光;行为对应用户发起...
特征包含两部分,属性和属性值。 一系列的特征的组合带来的是对某类具有代表性用户的具体描述。 真正好用的标签库不一定有非常多的标签,而是能够充分适...
文集作者