内容来自哈工大车万翔老师团队的作品《自然语言处理:基于预训练模型的方法》。
2.1 基于规则与基于机器学习的自然语言处理方法分别有哪些优缺点?
基于规则2.2 如何在词的独热表示中引入词性、词义等特征?请举例说明。
2.3 奇异值分解方法是如何反映词之间的高阶关系的?
2.4 在使用式(2-18)计算困惑度时,如果其中的某一项概率为0,如何处理?
2.5 若使用逆向最大匹配算法对句子“研究生命的起源”进行分词,结果是什么?是否可以说明逆向最大匹配算法要优于正向最大匹配算法?
2.6 2.2.2节介绍的子词切分算法是否可以用于中文?若能应用,则与中文分词相比有哪些优缺点?
2.7 是否可以使用序列标注方法解决句法分析(短语结构和依存两种)问题?若能使用,则如何进行?
2.8 使用何种评价方法评价一个中文分词系统?并请编程实现该评价方法。