240 发简信
IP属地:天津
  • 120
    External Shuffle Service 引起的NodeManager OOM问题分析

    1 现象描述及初步分析 近期公司yarn集群中存在NodeManager因OOM 而挂掉的情况, 且发生OOM前存在大量的Spark Shuffle Services相关信...

  • 120
    深度学习服务器环境搭建(nvidia-410.72 + cuda-9.0 + tensorflow_gpu-1.12)

    系统环境:centos7.4 内核版本:3.10.0-862.14.4.el7.x86_64 本教程安装nvidia驱动过程中需要linux内核源码编译驱动,第一次安装时机器...

  • 120
    使用ElasticSearch踩过的坑

    使用ElasticSearch将近3个月了,在使用过程中,陆陆续续踩了不少坑,每次觉得无法逾越时,心里都想放弃,一是因为这东西要完全掌握不是那么容易,需要花很多时间;二是如果...