240 发简信
IP属地:广东
  • 您好,请问【约25亿左右数据】是指25亿条数据还是数据大小有25亿,那单位是什么呢?小白求问

    Hive处理25亿数据之性能优化

    项目背景 有个关于分布式链路追踪呢项目,公司微服务460个左右,zipkin 日增数据约1.6T,约25亿左右数据。 通过清洗,输出不同5大维度维度,8种粒度的依赖视图,以及...

  • 大佬再写点啥

    浅谈 数据清洗

    预处理阶段 该阶段主要做2件事: 将数据原封不动的抽取导入,切记永远不要对源数据进行直接的清洗修改。 了解数据: 整理记录元数据,包括但不限于字段解释、数据来源、计算方式等 ...

  • 120
    浅谈BI

    引言 本文主要面向对象是,对BI完全不了解,或只是初步了解的人。从宏观角度介绍了BI的基本信息,并附以大量的图表作为说明。期望能帮助大家对BI有更深层次的理解。如有不同见解,...

  • 120
    数据方法论和分析方法,运用到实际业务场景应该注意这些!

    很多刚入门数据分析的小伙伴,甚至已经有做过几年数据分析的朋友在涉足不同行业或者场景的数据分析时,往往会不知道如何开始思考,一点思路都没有,然后就去咨询度娘,找找这个方法,找找...

  • 运营人员必备:分享如何维护公众号的技巧

    公众号设置后要进行发文与运营,但是如何维护呢,这是有技巧的,首先要明确一点的是公众号的运营核心是内容,重点是互动。在这个指导下运用相关的策略就能使公众号运营风生水起。下面分享...