处理步骤:
读入文本
分词
建立字典,将每个词映射到一个唯一的索引(index)
将文本从词的序列转换为索引的序列,方便输入模型
难点:
中文处理
实践(自己的两篇论文):
2017.10 《基于非结构化数据的松江区全域旅游发展监测研究》
2019.03 《从建国以来国务院政府工作报告看社会变迁》
链接:https://pan.baidu.com/s/1O9PR5JA0K8OfIvTaQdlRvw
提取码:02sb
处理步骤:
读入文本
分词
建立字典,将每个词映射到一个唯一的索引(index)
将文本从词的序列转换为索引的序列,方便输入模型
难点:
中文处理
实践(自己的两篇论文):
2017.10 《基于非结构化数据的松江区全域旅游发展监测研究》
2019.03 《从建国以来国务院政府工作报告看社会变迁》
链接:https://pan.baidu.com/s/1O9PR5JA0K8OfIvTaQdlRvw
提取码:02sb