240 发简信
IP属地:西藏
  • spark调优

    spark调优{ 1,资源调优{ a)搭建集群{ (1)配置目录在spark安装包中的conf下spark-env.sh (2)spark...

  • hbase热点问题(数据倾斜)解决方案---rowkey散列和预分区设计

    Hbase的表会被划分为1....n个Region,被托管在RegionServer中。Region二个重要的属性:Startkey与EndKe...

  • Resize,w 360,h 240
    SparkStreaming+Kafka的整合

    receiver模式 原理图: executor中会有receiver tasks接收kafka推送过来的数据,数据会被持久化,默认级别为mem...

  • Resize,w 360,h 240
    Elasticsearch的api做的万度后台代码实现

    学习了elasticSearch的内容,想将网页上爬取的网易的网页放入索引,实现跟百度一样的查询功能,特地做个万度给自己用,废话不多说直接上代码...