240 发简信
IP属地:山东
  • Hadoop简介

    Hadoop概述开源分布式计算平台,以HDFS、MapReduce为核心,为用户提供了系统底层细节透明的分布式基础架构.高容错、高伸缩MR允许用...

  • 题目:100w个数中找出最大的100个。 维护一个100个元素的小根堆即可。 或者直接维护一个用来存储当前最大的100个数的数组,每次把新来的数...

  • 有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求按照query的频度排序。

    将所有查询进行hash(query)%10,映射成新的10个文件,大约每个1GB。对每个文件使用hash_map统计频率并排序,然后对10个结果...

  • 海量日志数据,提取出某日访问百度次数最多的那个IP

    分析:IP总个数2^32 = 4G,如果单机用一个hash表来存储,光IP部分就得4G*4 = 16G,不现实 把文件按照hash(IP)%10...

  • 两个文件各有50亿个url,每个url各64字节,内存限制是4G,找出其中共同的url

    一个文件占用内存大小为5G x 64B = 320G,远大于实际内存4G,不能一次性载入内存。把每个文件中的url进行hash(url)%100...

  • (*)剑指offer 面试题32:从1到n整数中1出现的次数

    题目:输入一个整数n,求从1到n这n个整数的十进制表示中1出现的次数。 解法:

  • 剑指offer 面试题33:把数组排成最小的数

    题目:输入一个正整数数组,把数组里所有数字拼接起来排成一个数,打印能拼接处的所有数字中最小的一个。例如输入数组{3,32,321},则打印出这3...

  • (*)剑指offer 面试题43:n个骰子的点数

    题目:把n个骰子仍在地上,所有骰子朝上一面的点数之和为s。输入n,打印出s的所有可能的值出现的概率。 n个骰子的点数之和最小为n,最大值为6n,...

  • 剑指offer 面试题42:翻转单词顺序VS左旋转字符串

    题目一:输入一个英文句子,翻转句子中单词的顺序,但单词内字符的顺序不变。为简单起见,标点符号和普通字母一样处理。例如输入字符串"I am a s...

个人介绍
bat码农,谍战,篮球,大数据,广告