1.训练数据一定要定义成utf-8格式,然后生成的model在测试数据为utf-8的情况下会出现错误。
2.训练数据中不能有空字符,如果有空字符,CRF++的命令行就会出现错误。
3.读写文件的时候一定要定义好是utf-8格式。
4.在命令行显示中文字符的时候,一定要进行chch65001更改编码格式为utf-8。
不要用powershell
不要用powershell
不要用powershell
结果会乱码!!!!
用cmd!!!!!!
用cmd!!!!!!
用cmd!!!!!!
用powershell的话先执行命令 chch65001 改为utf-8编码
推荐用cmder https://cmder.net/ 一个第三方的命令行工具 在环境中添加默认代码页 chch65001