lhn_58fd - 简书

发简信

lhn_58fd

0
关注
0
粉丝
1
文章
7390

字数
0

收获喜欢

IP属地：北京

无标题文章
将强化学习应用于强大的基础模型，并结合已经验证的奖励机制，能够显著提升模型的推理能力和性能。Deepseek-R1、Kimi K1.5均是通过策...

19 0 0

暂无个人介绍