自然语言处理实验演示 - 18. Porter 词干提取
Porter 词干提取是最常用的词干提取算法之一,其基本原理是删除和替换英语中众所周知的单词后缀、前缀和复数 s。NLTK 具有 PoterStemmer 类,我们可以方便的使用 Porter 算法实现词干的提取。PoterStemmer 类知道几种常规的单词形式和后缀,借助它们可以将单词转换为词干,提取的词干通常是具有相同词干含义的较短单词。在本实验中,将应用 Porter 实现词干提取。
#知识# #校园学习# #NLP# #AI# #自然语言处理# #人工智能专业建设#
#词干提取# #stemming# #实验视频# #Python# #人工智能实验室# #NLTK#
个人用户获取相关代码及数据集,请访问企业网站 (www.080910t.com),扫描【知识微店(个人用户)】二维码关注或订阅。注:全部实验演示视频、代码、数据集仅授权予个人用户学习与实验使用,禁止用于二次销售、课堂教学及培训用途。
视频原创制作:广州跨象乘云软件技术有限公司