首先介绍一下本人背景:本科对外汉语专业,硕博自然语言处理方向偏语言学,对算法有了解,但没有实操过。
整体感觉一面更偏向具体的业务场景,二面更偏向过往经历,以及如何把过往经历迁移到具体场景中。
一面(50min左右)
- 自我介绍
- 所做过的一个项目介绍
- 有做过意图识别的相关工作吗?怎么理解意图?
- 说几个中文问天气的句式?英文问天气的句式
- 对买车情境进行一个意图分类
- 说了几个句子进行意图划分,具体到消费场景中,各自表示什么意思
- 怎么根据标注数据判断标注人员的水平?
- 意图识别一般用什么模型来做?说说你了解的深度学习模型原理
- 假如遇到外包团队接的项目比较多,对你的标注项目不够配合,怎么处理
- 如何从0到1构建意图标注体系?
- 说说自己学过的关于语义方面的课程,给几个句子进行了分词词性标注
- 介绍一下语义角色
二面(30min左右)
- 自我介绍
- 项目介绍
- propbank和所做项目的区别
- 谓词有多少个?如何分类?
- 另一个项目的介绍
- 接触过标注团队吗?标注过程中遇到的问题?
- 对于标注效果不理想的情况如何处理?
- 数据交接给算法,模型也训练完了,最后产品上线之后,效果不理想,分析一下可能的原因,如何应对
- 生活中遇到一天要完成多项工作时,如何应对?
- 标注过程中遇到的歧义怎么解决?
- 中文概念框架如何迁移到英文?如何确定英文的标注数据集?是否可以人工造句子?
三面(30min左右)
交叉面,面试官是做算法的
- 自我介绍
- 对话或者闲聊有什么标准可以判断好坏
- 有什么标准判断句子的流利度或完整性
- python用过哪些
- 正则表达式用那个包
- 用python给语料去重怎么做?
- 意图体系怎么设计
- 怎么确定意图体系是否合理
- 如何从大批数据中提取整理意图标注体系
- 怎样保证标注人员对标注体系认知的一致性
- 参与过哪些实际的业务?