自然语言处理实验演示 - 19. 执行词形还原(Lemmatization)
词形还原(Lemmatization)是文本预处理中的重要部分,与词干提取(stemming)很相似。简单说来,词形还原就是去掉单词的词缀,提取单词的主干部分,通常提取后的单词会是字典中的单词,不同于词干提取(stemming),提取后的单词不一定会出现在单词中。比如,单词 ate 词形还原后的单词为 eat。在 NLTK 中,使用 WordNet 为我们提供了稳健的词形还原的函数。
#知识# #校园学习# #AI# #NLP# #自然语言处理# #词形还原# #人工智能实验室#
#人工智能专业建设# #文本数据预处理# #实验视频# #Python# #NLTK#
个人用户获取相关代码及数据集,请访问企业网站 (www.080910t.com),扫描【知识微店(个人用户)】二维码关注或订阅。注:全部实验演示视频、代码、数据集仅授权予个人用户学习与实验使用,禁止用于二次销售、课堂教学及培训用途。
视频原创制作:广州跨象乘云软件技术有限公司
企业网站:https://www.080910t.com
Bilibili 官方主站:https://space.bilibili.com/189064479