写文章
注册
登录
首页
下载App
会员
IT技术
发简信
lhn_58fd
0
关注
0
粉丝
1
文章
7390
字数
0
收获喜欢
IP属地:北京
文章
动态
最新评论
热门
无标题文章
将强化学习应用于强大的基础模型,并结合已经验证的奖励机制,能够显著提升模型的推理能力和性能。Deepseek-R1、Kimi K1.5均是通过策...
19
0
0
暂无个人介绍
他关注的专题/文集/连载
他喜欢的文章