240 发简信
IP属地:浙江
  • 腾讯三面:40 亿个 QQ 号码如何去重?

    今天,我们来聊一道常见的考题,也出现在腾讯面试的三面环节,非常有意思。具体的题目如下: 文件中有40亿个QQ号码,请设计算法对QQ号码去重,相同的QQ号码仅保留一个,内存限制...

  • GraphX之Connected Components

    在Spark Graphx的org.apache.spark.graphx.lib包中有一些常用的图算法,其中一个就是Connected Components,本文将会介绍此...

  • 120
    SIMD的编写

    前言   学习SIMD的笔记 参考教程:SIMD Tutorial.pdf 一、使用SIMD的场景   考虑如下代码:   获取玩家速度,是个包含x,y,z三个分量的向量,然...

  • 大数据框架学习:从 Hadoop 到 SparkHadoop

    1. Hadoop是什么Hadoop软件库是一个利用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理的框架。特点:部署成本低、扩展方便、编程模型简单。Hadoop ...

  • 120
    深入理解Apache Flink核心技术

    Apache Flink(下简称Flink)项目是大数据处理领域最近冉冉升起的一颗新星,其不同于其他大数据项目的诸多特性吸引了越来越多人的关注。本文将深入分析Flink的一些...

  • 120
    大数据处理需要用到的九种编程语言

    大数据处理需要用到的九种编程语言 随着大数据的热潮不断升温,几乎各个领域都有洪水倾泻般的信息涌来,面对用户成千上万的浏览记录、记录行为数据,如果就单纯的Excel来进行数据处...