不满足于入门级问题?这里有10个大数据面试中级问题送你!

上一篇文章我们总结了10个大数据面试入门级问题,大家是否有收获,本次我们分析的是10个已经在大数据行业工作的老司机们面试时的问题及建议答案,话不多说,赶紧开始今天的学习。

基于大数据已从业者的面试问题

如果您在大数据世界中有相当丰富的工作经验,那么根据您以前的经验,您将在大数据面试中被问到一些问题。这些问题可能与您的经验或基于场景有关。所以,准备好这些最好的大数据面试问题和答案 。

11.您有大数据经验吗?如果有,请分享一下。

如何处理:  问题没有具体答案,因为这是一个主观问题,答案取决于您以前的经验。在大数据访谈期间询问这个问题,面试官想要了解您以前的经验,并且还试图评估您是否适合项目要求。

那么,你将如何处理这个问题呢?如果您有以前的经验,请在过去的职位上开始履行职责,并慢慢向对话添加详细信息。告诉他们您使项目成功的贡献。一般来说,这个问题是在面试中提出的第二或第三个问题。后面的问题是基于这个问题,所以请仔细回答。您还应该注意不要过度使用以前工作的一个方面。保持简单和重点。

12.您更喜欢好的数据还是好的模型?为什么?

如何处理: 这是一个棘手的问题,但通常在大数据面试中被问到。它要求您在好的数据或好的模型之间进行选择。作为候选人,您应该尝试根据自己的经验回答这个问题。许多公司希望遵循严格的数据评估流程,这意味着他们已经选择了数据模型。在这种情况下,拥有良好的数据可能会改变游戏规则。另一种方式也适用于基于良好数据选择的模型。

正如我们已经提到的,请根据您的经验回答。但是,不要说拥有良好的数据和良好的模型很重要,因为在现实生活中很难同时拥有这两个数据。

13.您是否会优化算法或代码以使其运行更快?

如何处理: 这个问题的答案应该始终是“是”。真实世界的性能很重要,它不依赖于您在项目中使用的数据或模型。

面试官可能也有兴趣知道您是否有任何以前的代码或算法优化经验。对于初学者来说,这显然取决于他过去从事过哪些项目。有经验的候选人也可以相应地分享他们的经验。但是,请诚实地对待您的工作,如果您过去没有优化代码,那就没关系了。只需让面试官了解您的真实体验,您就可以破解大数据访谈。

14.您如何处理数据准备?

如何处理: 数据准备是大数据项目的关键步骤之一。大数据访谈可能涉及至少一个基于数据准备的问题。当面试官问你这个问题时,他想知道你在数据准备过程中采取了哪些步骤或预防措施。

如您所知,需要数据准备才能获得必要的数据,然后可以进一步用于建模目的。你应该把这个消息传达给面试官。您还应该强调要使用的模型类型以及选择特定模型的原因。最后,但并非最不重要,您还应该讨论重要的数据准备术语,如转换变量,异常值,非结构化数据,识别差距等。

15.您如何将非结构化数据转换为结构化数据?

如何处理: 非结构化数据在大数据中非常常见。应将非结构化数据转换为结构化数据,以确保正确的数据分析。您可以通过简要区分两者来开始回答问题。完成后,您现在可以讨论用于将一个表单转换为另一个表单的方法。您也可以分享您所做的真实情况。如果您最近刚毕业,那么您可以分享与您的学术项目相关的信息。

通过正确回答这个问题,您发出信号表明您了解结构化和非结构化数据的类型,并且具有使用这些数据的实践经验。如果你具体回答这个问题,你肯定能够破解大数据访谈。

16.哪种硬件配置对Hadoop作业最有利?

配置4/8 GB RAM和ECC内存的双处理器或核心机器是运行Hadoop操作的理想选择。但是,硬件配置因项目特定的工作流程和流程而异,因此需要进行自定义。

17.当两个用户尝试访问HDFS中的同一文件时会发生什么?

HDFS NameNode支持独占只写。因此,只有第一个用户将收到文件访问权限,第二个用户将被拒绝。

18.如何在NameNode关闭时恢复它?

需要执行以下步骤才能启动并运行Hadoop集群:

使用文件系统元数据副本的FsImage启动新的NameNode。 

配置DataNode以及客户端以使它们确认新启动的NameNode。

一旦新的NameNode完成加载从DataNode收到足够块报告的最后一个检查点FsImage,它将开始为客户端提供服务。 

在大型Hadoop集群的情况下,NameNode恢复过程会消耗大量时间,这在日常维护的情况下将成为更大的挑战。

19.您对Hadoop中的Rack Awareness有何了解?

它是一种应用于NameNode的算法,用于决定块及其副本的放置方式。根据机架定义,同一机架内的DataNode之间的网络流量最小化。例如,如果我们将复制因子视为3,则将两个副本放在一个机架上,而将第三个副本放在单独的机架中。

20.“HDFS Block”和“Input Split”有什么区别?

HDFS将输入数据物理地划分为用于处理的块,这被称为HDFS块。

输入拆分是映射器用于映射操作的逻辑数据划分。

下集预告:干货|50个大数据面试问题及答案第三篇:10个大数据Hadoop面试问题

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,496评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,407评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,632评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,180评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,198评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,165评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,052评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,910评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,324评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,542评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,711评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,424评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,017评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,668评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,823评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,722评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,611评论 2 353

推荐阅读更多精彩内容