DeepSeek一夜爆火,全球都在关注且讨论DeepSeek,顶尖技术人员关注的是,R1版本是紧随openAI的o1版本推理能力的研究效果最好的模型、开源(开源代码、开源技术路线及技术细节,可商用)、性价比高,而且由中国团队研发。那对于我们这些应用小选手来说,这其中应该关注的是什么呢。
首先,这是一个国产模型,增强的是民族技术水平的信心,同时也引起美国AI从业、关注者的极大注意力;这是一个开源模型,是一场开源对于闭源的胜利。
其次,作为完全开源的国产模型,DeepSeek的性价比高、性能好、思考效率高。R1思考速度快而且非常省钱。官网直接用,它是免费的。如果是在自己的应用中调用API,它的输出价格是一百万tokens 2.19美元,相当于o1 60美元的4%!模型参数量为6710亿个模型参数,一次推理调用仅需370亿个参数,硬件资源要求低、算力要求小。在技术选型中,DeepSeek可作为其中一个重要的选项。
然后,作为推理模型,DeepSeek R1在数学、编程、推理任务中,跑分已经达到或接近O1,但R1在生成洞见、创造性发挥和说理论证方面,比O1还有一定的距离。另外R1支持联网搜索和PDF阅读,而O1还没有这两个功能。但作为一个研究型模型,R1的稳定性、为用户提供服务的工程能力还相对较弱。在模型应用中,要清晰了解R1的能力边界,以更好地筛选和应用。
我们一直在模仿、追随,而这一次,终于有了平行的可能。
当然,作为新秀军,DeepSeek有较强的潜力,需持续关注其进展,以更好地应用到自己的产品和项目中。
【一个小目标】92/365,关注行业关注趋势,多看多想多反思,做一个讲故事的人,讲一个好故事。