2022-02-09 第二章习题

内容来自哈工大车万翔老师团队的作品《自然语言处理:基于预训练模型的方法》。

  • 2.1 基于规则与基于机器学习的自然语言处理方法分别有哪些优缺点?
    基于规则

  • 2.2 如何在词的独热表示中引入词性、词义等特征?请举例说明。

  • 2.3 奇异值分解方法是如何反映词之间的高阶关系的?

  • 2.4 在使用式(2-18)计算困惑度时,如果其中的某一项概率为0,如何处理?

  • 2.5 若使用逆向最大匹配算法对句子“研究生命的起源”进行分词,结果是什么?是否可以说明逆向最大匹配算法要优于正向最大匹配算法?

  • 2.6 2.2.2节介绍的子词切分算法是否可以用于中文?若能应用,则与中文分词相比有哪些优缺点?

  • 2.7 是否可以使用序列标注方法解决句法分析(短语结构和依存两种)问题?若能使用,则如何进行?

  • 2.8 使用何种评价方法评价一个中文分词系统?并请编程实现该评价方法。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容