数据仓库系列文章 数仓架构发展史[https://www.ikeguang.com/?p=1582] 数仓建模方法论[https://www.ikeguang.com/?p=...
数据仓库系列文章 数仓架构发展史[https://www.ikeguang.com/?p=1582] 数仓建模方法论[https://www.ikeguang.com/?p=...
Time will tell. (咳咳 . . .) 1、先来说冒烟测试 冒烟测试是自由测试的一种。 冒烟测试在测试中发现问题,找到了一个bug,然后开发人员来修复这个bug...
1.总括 相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文...
精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。用公式表达如下: ...
1.正排索引 2.倒排索引 通过内容搜索出id 2.词频/位置
口径是取数逻辑(如何取数的),比如要取的数是10岁以下儿童中男孩的平均身高。维度是我取数的依据字段:年龄、性别、身高。指标是口径的衡量值,也就是最后的结果。
特别喜欢那种, 可以心安理得什么事都不做的时刻。 比如说出远门坐大巴的时候, 什么事都做不了,就可以肆无忌惮地发呆了。 刚好沿路的风景也还行,可以听会儿歌。 以前没有觉得这种...
生活中,经常会有这样的事发生: 别人不经意间的一个举动,一句话,一个表情,我们却很容易在心里兀自揣测,各种解读。 时间久了,弄得自己很累,活得不快乐。 其实,我们的面前并没有...
大数据平台通过将所有数据整合起来,充分分析与挖掘数据的内在价值,为业务部门提供数据平台,数据产品与数据服务。大数据平台接入的数据中可能包括很多用户的隐私和敏感信息,如用户在酒...
我喜欢的城市她不大,依山傍海。她没有超高层的建筑,城市建筑与这块土地相处的恰当好处,就好像是她就是这样的,这样最合理,这样最美。她的道路多以花的名字命名,海棠路,紫荆路,百合...
停用词 停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。...
自然语言处理简介 现在,让我们先从介绍自然语言处理(NLP)开始吧。众所周知,语言是人们日常生 活的核心部分,任何与语言问题相关的工作都会显得非常有意思。希望这本书能带你领略...