240 发简信
IP属地:河南
  • 120
    算法的时间复杂度和空间复杂度

    一、算法效率的度量方法 1.事后统计方法 这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。 2.事前...

  • 120
    Spark实时离线电影推荐系统

    1 项目介绍2 涉及的技术3 推荐流程图4 收获5 问题 1 项目介绍 使用Spark框架实现电影推荐系统; 运用数据挖掘的算法产生模型,为用户精准推荐喜好的电影; 分别通过...

  • 120
    LSM树原理、应用与优化

    前言:为什么传统数据库使用B树较多,而大数据存储使用LSM树较多?kudu为什么比hbase更适合支持OLAP查询? 上一篇场景和挑战 提到数据系统最基本的需求就是数据存取,...

  • SparkStreaming读Kafka- Couldn't find leader offsets for Set([tt,0], [tt,1], [tt,2])

    在运行SparkStreaming程序时,出现了这样的错Couldn't find leader offsets for Set([tt,0], [tt,1], [tt,2]...

  • SparkStreaming读Kafka- Couldn't find leaders for Set

    在运行SparkStreaming程序时,出现了这样的错Couldn't find leaders for Set([tt,1], [tt,2]))这个异常意思是Spark找...

  • 120
    Spark Job执行流程源码解析

    上一篇文章讲解了RDD的基本概念, 这篇文章尝试分析当Spark拿到一个RDD之后是如何处理它的. 文中会涉及到Spark内部的实现细节, 希望通过本篇文章让大家对Spark...

  • hadoop集群时间同步

    同步方式 选择一个机器,作为时间服务器(这里选择hadoop01),所有的机器与这台集群时间进行定时的同步,比如,每隔十分钟,同步一次时间。 所需工具 时间同步服务器有两...

  • Java归并排序,代码,优缺点

    一. 概念 归并的含义是将两个或两个以上的有序表合并成一个新的有序表。大体分成,两路归并排序,和多路归并排序。用于内排序,和外排序。(此篇主要介绍两路内排序) 二. 归并排序...

  • 堆排序

    一、什么是堆排序 堆排序是将数组看做一个完全二叉树(附录里有二叉树的解释),具有以下的性质: 1)每个节点的值都大于子节点的值,叫做大顶堆。 2)每个节点的值都小于子...

  • 120
    JAVA 实现快速排序

    高效的分治排序 快速排序是冒泡排序的改进版,是目前已知的最快的排序方法。 该排序算法的基本思想是: 1.先从数列中取出一...