IP属地:新疆
一、下载软件anaconda介绍:是一个用于科学计算的 Python 发行版,支持 Linux, Mac, Windows, 包含了众多流行的科...
一、什么是用户画像 用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通...
数据倾斜原理 在进行shuffle的时候,必须将各个节点上相同的key拉取到某个节点上的一个task来进行处理,比如按照key进行 聚合或joi...
对于同一份数据,只应该创建一个RDD,不能创建多个RDD来代表同一份数据 应该尽量复用一个RDD,这样可 以尽可能地减少RDD的数量,从而尽可能...
年轻代,老年代,永久代(Metaspace )存放什么对象? heap包含年轻代和老年代,永久代是另一块内存; 年轻代用来存放新近创建的对象,对...
堆内存介绍1.堆内存分为Eden,Survivor,Tenured/old空间;2.从年轻代空间(包括 Eden 和 Survivor 区域)回...