Avatar notebook default
9篇文章 · 3048字 · 6人关注
  • 09 使用python完成词频统计

    1 系统、软件以及前提约束 CentOS-7 64为减少linux权限对初学者造成影响,所有命令均在linux的root权限下进行操作。 已安装...

  • Resize,w 360,h 240
    08 使用zookeeper保证namenode、resourcemanager的高可用性

    上一篇文章,我们完成了hadoop的集群安装,但从机子的节点分布图中我们可以看到namenode只在master机子上存在,一旦该机子宕机,则H...

  • 07 安装hadoop集群

    通过上面几篇文章,我们熟悉了单机情况下的HDFS操作和MapReduce计算,在实际使用中,为了提升性能和稳定性,大数据组件都会以集群的方式存在...

  • 06 java完成自定义的词频统计

    上一篇文章我们测试了hadoop自带的词频统计,本节将使用java完成自定义的词频统计。 1 系统、软件和前提约束 完成java访问HDFS服务...

  • 05 测试hadoop自带词频统计demo

    在了解了Hadoop中的存储组件HDFS之后,我们再来看一下Hadoop中另一个重要组件的计算MapReduce。HDFS搞定海量的存储,Map...

  • Resize,w 360,h 240
    04 在eclipse中查看HDFS

    在上面的例子中,我们通过java代码对hdfs进行了操作,操作结果我们可以用代码继续查看或者通过命令行获得,但不论哪一种都不够直观,eclips...

  • 03 java访问HDFS服务

    上一节课我们熟悉了HDFS的命令行操作,接下来我们将通过java代码访问HDFS服务。 1 系统、软件以及前提约束 hadoop已经安装完毕并且...

  • 02 HDFS的命令行操作

    在安装好Hadoop之后,我们来熟悉在命令行界面当中操作分布式文件存储组件HDFS。 HDFS是Hadoop大数据平台中的分布式文件系统,为上层...

  • Resize,w 360,h 240
    01 在CentOS7中安装Hadoop

    hadoop是大数据入门组件,主要包括两个服务,hdfs以及mapreduce,前者是存储,后者是计算。本文将阐述hadoop的安装。 1 系统...

文集作者