暑期实习-百度.md

2018年04月14日

---

# 技术一面(60分钟)

> 基本全程在问项目(实验室项目、实习项目),根据项目中的知识点纵向展开追问,最后问了些有关线程和集合框架的内容

* 自我介绍

* 久其实习项目

 * 业务背景,自己所完成的功能,为什么要这么做?

 * 为什么使用HBase替换Oracle?

 HBase的表结构的设计

 rowkey是如何设计的?

 * 如何使用Kettle实现数据的ETL工作?

  数据格式之间是如何进行转换的?

  在Kettle的面板组件上通过js脚本实现数据的清洗、维度的统一、最后文本文件的导出

 * 如何使用MR将数据导入HBase?

 说一下具体的实现(简单的映射)

 * 感觉MongoDB也可以实现你的需求,为啥用HBase呢?

 * 这个数据的规模有多大呢?(几百G吧)

 * 这个MR批量数据导入的速度大概是多少呢?(几万条的话10分钟吧),离线的还是实时增量呢?

 * 导数据在运行的时候如何保证数据一致呢?

 * 为什么选取Phoenix作为中间引擎

 怎么对Oracle语句进行解析?

 说一下简单工厂的思想,画一下UML,是不是可以用语法解析树实现呢?

 怎样对可解析SQL语句的种类进行扩充?增加产品类

 * 是怎样保证数据的事务的?

 存在并发读写的情况怎么解决?

 一条记录的不同字段进行分次更新时可能遇到覆盖,怎么解决?(一次push一条记录,不存在这样的问题)

 * 对于数据倾斜是怎么解决的?

 说一下Phoenix的数据加盐的底层实现原理

 数据加盐有什么样的好处呢?

 * 二级索引有没有用到?

 如何构建的二级索引表呢?

 Phoenix的两种二级索引表有什么区别呢,优劣?

 二级索引的底层实现原理是什么?

 * 搭建的web平台的功能是什么?

 * 在久其都干了什么?简单介绍下日常工作

* 实验室项目

 * 介绍下项目背景,技术实现

 你在项目小组中是什么角色呢?

 * 影响最大化的算法的实现原理

 * 简单画一下项目的架构设计

 算法(graphx) -> jar -> hdfs

 jobserver承担着什么角色,如何对job进行调度?

 * 情感分析使用的什么分词工具

 怎么通过java调用python

 * 数据是怎获取的?

* 基础知识

 * 如果实现多线程呢?

 常用线程池

 不同线程之间的变量共享,theadlocal

# 技术二面(60分钟)

* 基础知识

 * JVM内存模型

 每个分区的作用

 哪些分区时共享的,哪些分区时私有的?

 垃圾回收算法(常见描述,对比优劣)

 判断一个对象是否可回收(判断引用类型)

 * 虚拟内存

 * JDK, JRE, JIT

 * 集合框架

 HashMap内部实现,存储于读取的内部流程

 ArrayList, LinkedList的内部实现原理与区别

 HashMap与HashTable之间的差异

 HashSet实现原理

 * 如何实现多线程

 创建线程

 线程共享变量

 线程安全

 线程池

 * 线程与进行的区别

 * TCP, UDP区别

 * TCP三次握手

 * 设计模式知道哪些?

 * 二叉树的前中后序遍历的区别

 * 数据库索引,B树介绍原理

 * 编译型语言和解释型语言的区别

 * HDFS的原理

 * 对数据仓库的理解

 * 目前有再看哪方面的技术书籍

 * 有什么想完善的技术栈

* 算法

 * 求二叉树的最短叶子节点的深度(手写)

 * 用栈模拟实现队列(说思路)

# 技术三面(40分钟)

* 线程池了解吗?

 线程池的分类

 有哪些常用的线程池

 如何构造一个自己的线程池

 当任务数量多于线程池中的线程数量时,应该怎么办?(消息队列)

* shell脚本说一下实现思路

 如果有任务执行失败了应该怎么办,在运行的时候而不是通过日志进行判断

* Hbase数据更新的原理,timestamp

* 在久其的主要工作,承担一个什么样的角色

* 实验室的项目中承担着什么样的角色

* 对百度有什么看法?

* 有什么想问他的?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,634评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,951评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,427评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,770评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,835评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,799评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,768评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,544评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,979评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,271评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,427评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,121评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,756评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,375评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,579评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,410评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,315评论 2 352

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,922评论 2 89
  • 这世界是人与人的关系形成的,而城市却是最好的联络者。有人因为一座城恋上一个人,有人因为一个人恋上一座城,不管是哪种...
    王小粉儿阅读 250评论 1 0
  • 为了身材以及健康着想,减肥是必须进行的。那么男人瘦肚子的最快方法有哪些呢? 男人瘦肚子的最快方法 一、进行有效的锻...
    赛乐赛小芳_ffd8阅读 468评论 0 0
  • 很多的时候,感觉身边有很多我们 走着走着,我们就散了 不敢说想做清澈的自己 只是执拗于内心真实的感...
    素心人对素心花阅读 200评论 3 9