240 发简信
IP属地:贵州
  • 120
    jupyter手把手指南

    一、下载软件anaconda介绍:是一个用于科学计算的 Python 发行版,支持 Linux, Mac, Windows, 包含了众多流行的科学计算、数据分析的 Pytho...

  • 120
    用户画像介绍

    一、什么是用户画像 用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼...

  • rdd数据倾斜调优

    数据倾斜原理 在进行shuffle的时候,必须将各个节点上相同的key拉取到某个节点上的一个task来进行处理,比如按照key进行 聚合或join等操作。此时如果某个key对...

  • 开发调优

    对于同一份数据,只应该创建一个RDD,不能创建多个RDD来代表同一份数据 应该尽量复用一个RDD,这样可 以尽可能地减少RDD的数量,从而尽可能减少算子执行的次数。 对多次使...

  • gc初步了解2

    年轻代,老年代,永久代(Metaspace )存放什么对象? heap包含年轻代和老年代,永久代是另一块内存; 年轻代用来存放新近创建的对象,对象更新速度快,在短时间内产生大...

  • gc初步了解

    堆内存介绍1.堆内存分为Eden,Survivor,Tenured/old空间;2.从年轻代空间(包括 Eden 和 Survivor 区域)回收内存被称为 Minor GC...

  • 120
    用大白话告诉你,什么是区块链和简书钻。

    最近,很多人都在问,到底什么是简书钻?到底什么是区块链?在这里我就用大白话给大家讲一讲,有不对之处,还望指正。 一、什么是区块链? 相信,凡是经常玩简书的人,现在对“区块链”...

  • 使用python/flask实现鉴权

    上一篇文章介绍了使用JWT协议来做token认证的功能,继续装逼下去,怎样实现一个鉴权的模块? 假设token认证的功能已经完成,那么设定为每次请求头部中都带上这个token...

个人介绍
这世间所有的相遇都是久别重逢