240 发简信
IP属地:台湾
  • @SeanCheney 看到了 谢谢。

    《利用Python进行数据分析·第2版》第14章 数据分析案例

    本章给出的数据集已经比较老了,最近发现一家非常好的公开网页数据网站 brightdata.com[https://brightdata.grsm.io/bigdatareso...

  • 大神 样例数据能打个包,提供下载下么;

    《利用Python进行数据分析·第2版》第14章 数据分析案例

    本章给出的数据集已经比较老了,最近发现一家非常好的公开网页数据网站 brightdata.com[https://brightdata.grsm.io/bigdatareso...

  • centos thrift 搭建

    前言 为了能给.php的程序提供访问平台服务接口,以管理Hadoop/Spark集群,安装Thrift Thrift介绍 Thrift是一个软件框架,用来进行可扩展且跨语言的...

  • 文本处理之awk

    awk内置变量 awk有许多内置变量用来设置环境信息,这些变量可以被改变,下面给出了最常用的一些变量。 ARGC 命令行参数个数ARGV ...

  • tensorflow安装

    环境介绍 因为Ubuntu版在服务器上按得,没图形界面,很不方便,所以windows也按了个,都是Anaconda 按得python3.6 虚的python3.5 tenso...

  • paddlepaddle安装

    环境介绍 操作系统:centos6.6运行paddlepaddle过程中会需要一些基础包,缺失是yum安装下,在把python重新编译安装下基础环境:python2.7.10...

  • 文本处理之sed

    简介 sed 是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内...

  • spark on yarn 搭建

    原理 Spark on YARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好hadoop HDFS并且运行在yarn上,然...

  • oozie mysql配置

    修改oozie配置文件 oozie有元数据服务,默认的元数据数据库是derby,需要修改为mysql; 创建mysql oozie库 /usr/local/mysql/bin...

  • 120
    oozie简单搭建

    oozie搭建 下载 http://archive-primary.cloudera.com/cdh5/cdh/5/ 全部采用cdh版本搭建 oozie-4.1.0-cdh5...