240 发简信
IP属地:广西
  • Python笔记_6_jieba 分词自定义词典问题

    自定义长词,能够被jieba分出来。 自定义短词,和重新组合字的新词,不能被结巴分出。 即,自定义词典中的词只能是结巴分出的词的组合,否则没有任何效果。 测试代码: #enc...

  • jieba分词用默认字典可以分出大和数据,现在想分成大数据这个词,用自定义字典,写入了大数据及词频,发现只有全切模式有效。于是又把大和数据两个词都写入自定义字典,这时三种模式都有效。我想问一下,这时什么原因,是不是我每次都得按后一种方法操作,还是我哪里出了问题,能帮忙解答一下吗?非常谢谢!

    Python笔记_6_jieba 分词自定义词典问题

    自定义长词,能够被jieba分出来。 自定义短词,和重新组合字的新词,不能被结巴分出。 即,自定义词典中的词只能是结巴分出的词的组合,否则没有任何效果。 测试代码: #enc...