240 发简信
IP属地:北京
  • 特征设计的整体思路

    主表——用户行为特征表包含了样本的所有基本字段: 特征名 数据类型user_id string → 用户 iditem_id u...

  • TensorFlow 中的样本与数据类型

    Example & Feature —— 与样本存储相关的消息类型tf.Example 是一个消息类型,其结构为:Dict[str, tf.Fe...

  • 工程师的成长心法

    永远不要觉得自己是高级技术人才 硬着头皮,去解决最基础的 bug,看最基础的说明文档,干最土、最扎实的事情 遇到一点就记一点,能记住的就用脑子,...

  • 2023-03-15 巡航模式 plan

    06:00 am 起床学习, 刷题等; 06:45 am 洗漱; 07:00 am 出门; 08:20 am 到达公司, 吃早饭; 08:40 ...

  • 2023-03-15 拯救计划 - 第二天

    今天补充一下拯救计划的第二项, 加上第一项, 合并内容如下: 例行的事情, 进入巡航模式, 不要思考意义; 无解的事情, 进入回避模式, 不要控...

  • 2023-03-14 拯救计划 - 第一天

    今天是拯救计划的第一天, 这项计划会通过实践不断丰富其内容. 结合今天的实践, 我为自己定义了第一个子项, 即: 日常 routine, 进入巡...

  • 2023-03-14 迎接崭新的我

    这几天非常消极, 不仅仅是没有晋升导致的, 更多的是不知道未来的方向在哪里. 眼前看似有很多选择, 但完全没有任何动力做事情. 最近一直都靠买买...

  • OOM 问题的分析方法

    堆内存 (on-heap memory) 即为 JVM 内存. 机器内存中不属于堆内存的部分即为堆外内存 (off-heap memory). ...

  • Resize,w 360,h 240
    Spark RDD join 优化

    大表 join 小表 -> broadcast join对小的 RDD 调用 collectAsMap() 回收至 driver, 再将其 b...

个人介绍
不断追求最佳实践