小文件是如何产生的 动态分区插入数据的时候,会产生大量的小文件,从而导致map数量的暴增 数据源本身就包含有大量的小文件 reduce个数越多,生成的小文件也越多 小文件的危...
小文件是如何产生的 动态分区插入数据的时候,会产生大量的小文件,从而导致map数量的暴增 数据源本身就包含有大量的小文件 reduce个数越多,生成的小文件也越多 小文件的危...
网上流传较广的50道SQL训练,奋斗了不知道多久终于写完了。前18道题的难度依次递增,从19题开始的后半部分算是循环练习和额外function的附加练习,难度恢复到普通状态。...
pandas 数据索引与选取 我们对 DataFrame 进行选择,大抵从这三个层次考虑:行列、区域、单元格。其对应使用的方法如下:一. 行,列 --> df[]二. 区域 ...
上篇我们已经进入了比特币的网络节点部分,并且了解了本机节点是如何获取自己的IP地址与外网地址的,我们现在接着往下看:使用域种子(dnsseed)查找节点。 我们先了解下域种子...
数据库三范式是什么?第一范式:表中每个字段都不能再分。第二范式:满足第一范式并且表中的非主键字段都依赖于主键字段。第三范式:满足第二范式并且表中的非主键字段必须不传递依赖于主...
快速排序的基本思想是:通过一趟排序将待排记录分割成独立的两部分,其中一部分记录的关键字均比另一部分记录的关键字小,则可分别对这两部分记录继续进行排序,已达到整个 序列有序....
本文内容大多参考《图解HTTP》一书 1. 使用Cookie来管理状态 HTTP 是无状态协议,说明它不能以状态来区分和管理请求和响应。也就是说,无法根据之前的状态进行本次的...
今天为啥又聊 Merkle Tree 呢? 我们地球上大部分人应该连它的名字都没有听过,而且说实话它也是个比较传统的概念了。Merkle Tree 是由计算机科学家 Ralp...
简析TCP的三次握手与四次挥手 TCP是什么? 具体的关于TCP是什么,我不打算详细的说了;当你看到这篇文章时,我想你也知道TCP的概念了,想要更深入的了解TCP的...
算法 高德纳在《计算机程序设计艺术》里对算法归纳为以下几点: 输入: 一个算法必须有零或以上的输入量输出: 一个算法应有一个或以上的输出量明确性: 算法的描述必须无歧义,实际...
JSONP 核心是 CORS 核心是 降域 浏览器中不同域的框架也是不能通过js进行交互的,但是不同框架之间可以获取到window对象,但却无法获取到相应的属性和方法。 例如...
初学JavaScript时,我在闭包上,走了很多弯路。而这次重新回过头来对基础知识进行梳理,要讲清楚闭包,也是一个非常大的挑战。 闭包有多重要?如果你是初入前端的朋友,我没有...
浮动元素的特征,对父容器、对其他浮动元素、普通元素、文字的影响。 浮动会使应用的元素脱离文档流。按指定的位置来移动位置。当遇到其父元素或者相邻的元素时即停下。此样式可用于 块...