240 发简信
IP属地:上海
  • hive-交叉数据-grouping set()函数用法

    做流量数据分析的小伙伴经常会遇到流量数据多维度汇总的问题,比如运营希望看到分城市,业务线,用户类型,频道,一级类目和二级类目等维度的交叉数据,因为整体UV并不等于各维度UV的...

  • hive处理json数据-get_json_object(),keyvalue(),explode()和LATERAL VIEW()函数简介

    数据分析小伙伴应该经常会遇到各种奇葩的源数据,尤其是业务复杂的公司,底层表的备注信息里会有大量的业务信息(大多是json格式),因为产品经理和开发人员的习惯和喜好不同,备注字...

  • 乍浦路桥

    看来《安家》电视剧,决定用一年时间,走遍剧中的每个景点和酒店。。

  • 旅游日记

    1、乍浦路桥 2、武康路

  • 如何学好英语

    提起英语,我想大多数人都会有一段不怎么美好的回忆,上学的时候学英语更多的是为了考试毕业,那时候不得不学,工作以后,大部分人会面临内心知道英语很重要但是工作又用不到的尴尬...

  • 2020人生新的起点

    不知不觉,人生已经过了30年。。。回首上一个10年,努力学习考入名牌大学,毕业后进入国企,不甘心在一个三线城市过一辈子毅然去深圳,后来又到了杭州。。。虽然过程曲折离奇,...

  • 了解日本

    《日本战后经济史》

  • 120
    武康路一日游

    总目录 上海第二站——武康路,一个特别适合悠闲散步的好地方,,, 现在回想起来,当时太匆忙,错过了很多美景,比如特别有情调的咖啡店,特别整洁的街道,特别错落有致的街边建筑,,...

  • python

    1)Python实现EXCEL常用操作——pandas简介 2)python-安装第三方包 3)python可视化-seaborn/m

  • 120
    如何有效管理信息

    注:本文参考书籍《0秒思考》,《如果有效整理信息》,《如何有效阅读一本书》 刚刚写完如何收纳房间的杂物(房屋收纳技巧),突然想到我们日常接触的信息可比那些有形的杂物多太...

  • 120
    房屋收纳的技巧

    注: 1)本文主要参考《小家,越住越大》 2)因为我本人是租房一族(自如合租),所以这里只写单间如何进行收纳 如何收纳自己的房间呢?这是我思考了很多年的问题,也是我这些...

  • 随机森林原理

    1、随机森林步骤1)给定包含N个样本的数据集,经过m次有放回的随机抽样操作,得到T个含m个训练样本的采样集2)对每个采样集,从所有属性中随机选择k个属性,选择最佳分割属性作为...

  • Adaboost原理

    AdaBoost的基本步骤是调整每次分错样本的权值训练过程中,如果某个样本点已经被准确地分类,那么在构造下一个训练集中,它的权值就被降低;相反,如果某个样本点没有被准确地分类...

  • 120
    Xgboost原理和应用

    xgboost作为新出现的集成算法,在各种大赛和实际项目中,取得了很好的效果,本文略去复杂的推导过程,简单讲解原理和python实现 一、直接上代码xgboost.XGBCl...

  • 120
    决策数及随机森林

    本来以为决策树很简单,所以初次写这篇帖子的时候也没仔细深究,后来学到xgboost的时候有些环节怎么想不明白,后来才知道 原来核心原因还是CART的原理没有搞清楚,于是回来老...

个人介绍
敲代码的文艺青年