240 发简信
IP属地:广东
  • wordcount

    安装pyspark通过拷贝pyspark包安装源目录:D:\software\spark-2.2.0-bin-hadoop2.6\python\...

  • Jupyter配置教程

    将jupyter notebook作为pyspark的默认编辑器 安装pyspark通过拷贝pyspark包安装源目录:D:\software\...

  • PyCharm安装教程

    下载pycharm-professional-2019.2.1 安装PyCharm安装目录:D:\software\PyCharm_2019 配...

  • Anaconda3安装教程

    下载Anaconda3-2019.03-Windows-x86_64.exe 安装Anaconda3安装目录:D:\software\Anaco...

  • WordCount

    新建Maven项目选择模板:scala-archetype-simple 配置pom文件<?xml version="1.0" encoding...

  • PySparkSQL脚本模板

    PySpark模板分为shell脚本和python脚本两部分,通过shell脚本提交spark任务。 shell脚本:test_submit.s...

  • Resize,w 360,h 240
    数据仓库(一)之需求篇

    原文链接:https://blog.csdn.net/mark_wu2000/article/details/82630852 概述 业务需求定...

  • Hive必知必会

    这是Hive知识点的一个大纲,后续会不断地更新完善,做到对Hive相关知识点有一个比较全面的总结归纳,争取2020年7月之前完成 环境搭建 Hi...

  • 维度建模理论

    下面介绍维度建模的基本概念及过程 维度表和事实表 维度建模过程 选择业务流程 声明粒度 确认维度 确认事实