240 发简信
IP属地:北京
  • 用人话解释基金行业术语(有偏差,轻喷)

    交易份额和交易金额:购买基金的两种方式,可以简单理解为,前者是买猪肉的时候说要买几斤,后者是直接告诉店家说要买多少钱的肉。不过最终在基金公司都会转化为份额来计算。 份额类型:...

  • spark支持hive

    要把hive下的hive-site.xml拷贝到spark的conf文件夹下。py4j.protocol.Py4JJavaError: An error occurred w...

  • 120
    一个指标的诞生

    一个指标的诞生过程 指标创建涉及到的团队主要有业务需求方和数据管理团队。指标在创建的时候要以数据为基础、以业务需求为导向。以业务需求为导向即首先要了解业务说的是什么,首先明白...

  • 指标体系(前言)

    数据的存在是为了创造价值,指标是最简单直接的方式。指标体系=指标+体系。指标即对于某种业务属性的度量,这个定义有三层含义:1.可描述性。指标的定义一定要有实际的业务价值,马斯...

  • 数据血缘

    数据血缘的定义 数据血缘即数据的来龙去脉,主要包含数据的来源、数据的加工方式、映射关系以及数据出口。数据血缘属于元数据的一部分,清晰的数据血缘是数据平台维持稳定的基础,更有利...

  • 120
    数据分层的思考

    数据分层的目的在于让数据有序的流转,在数据的整个生命周期中更清晰的被感知到。 关于数据分层,重点应该是在于功能、数据流,而不是形式,例如一定要分几层,一定要叫什么名字。 从功...

  • 数据汇集-数据汇集范围

    整体思路 数据仓库建设的第一步即数据汇集。在数据汇集时总要先明确数据要同步的范围。一般情况下,只有有意义的数据才会进行汇集。有意义的数据即:1.有真实的业务含义2.可以正确的...