在训练数据中添加<think></think>标记,最终在输出中筛选出</think>,部分大语言模型存在<think>溢出的情况,比如出现了</think>……内容……</think>在开头而不是<think>……内容……</think>,导致result结果变成了思考内容

image.png
在训练数据中添加<think></think>标记,最终在输出中筛选出</think>,部分大语言模型存在<think>溢出的情况,比如出现了</think>……内容……</think>在开头而不是<think>……内容……</think>,导致result结果变成了思考内容