240 发简信
IP属地:浙江
  • Resize,w 360,h 240
    [Linux]文件传输技巧

    缘起 最近为了排查线上系统问题,让运维小哥导一份线上系统日志,运维小哥觉得线上导线下觉得十分麻烦,而我只需要在线上开发机可看就可以了,这个就把运...

  • Resize,w 360,h 240
    MLSQL实战--利用docker快速搭建MLSQL运行环境

    摘要 MLSQL依赖于Spark,而且算法模块依赖于conda来管理python包。本文将介绍如何用docker快速搭建mlsql的运行环境。 ...

  • spark sql 调试技巧--内置udf查看

    spark sql 调试技巧--内置udf查看 Spark SQL内置了许多常用的udf,我们该如何拿到用户的udf和内置的udf呢? Data...

  • log4j2利用SocketAppender将日志写入rsyslog

    log4j2利用SocketAppender将日志写入rsyslog 摘要:利用elk(elasticsearch/logstash/kiban...

  • Resize,w 360,h 240
    推荐系统

    推荐系统是今年的主要工作之一 整体架构 推荐系统可以说是一个闭环的生态系统了。从整体架构图中,我们就可以看出来,推荐列表从RankServer产...

    0.5 5166 1 22 1
  • Resize,w 360,h 240
    Spark源码解析之Shuffle Writer

    摘要:Shuffle是MapReduce编程模型中最耗时的一个步骤,而Spark将Shuffle过程分解成了Shuffle Write和Shuf...

  • Java命令行工具学习--jps详解

    title: Java命令行使用 本文我们将对java内置命令行使用分析,这些命令行在java程序优化中扮演着重要的角色。 Jps 功能 jps...

  • Resize,w 360,h 240
    Spark高效数据结构

    Spark Streaming在状态管理时应用了一些高效的数据结构,本文我们就来看下这些数据结构的实现。 BitSet OpenHashSet ...

  • YARN开启Label Scheduler

    Spark Streaming实时长时服务与MapRedue、Spark、Hive等批处理应用共享YARN集群资源。在共享环境中,经常因一个批处...