最近快要被“鸡排哥”刷屏了,那么谁是鸡排哥呢?
为啥他会火?
这不,为了紧跟下这个新晋网红,我决定用节前刚发布的DeepSeek最新版V3.2 Experimental来帮我全方位解读下。
动态简约的风格,可以手动切换上下页,丝滑的滑动效果。文末有PPT每页的截图。原来啊,鸡排哥是景德镇的,被网友调侃为“6元的鸡排,60元的情绪价值,600元的服务。”摆摊近20年的鸡排哥,没想到自己坚持初心的服务态度,居然在如今这个如此看重情绪价值的当下火了🔥还是机会给到了有准备的人吧。他下午4点半后准时到校只卖给学生,而且价格比散客还便宜一元,“炸不到位,我不会原谅我自己的态度”。
是当下这个时代坚守人情味和品质的最好嘉奖。
再来聊聊这个最新版本的DeepSeek吧。
登录官网就可以体验,APP也行,为了确认是新版本,我特意问了它,没错!
DeepSeek还是保持了节前就要来一波更新的不让人好好过节的节奏。从春节前的DeepSeek-R1横空出世,到端午节前的DeepSeek-R1-0528版本,现如今国庆节前又来!关键9月22日一周前刚发布了DeepSeek-V3.1-Terminus,这是个终结版,原来只是终结了V3.1。V3.2一周后马上就来,不像深度求索的发版节奏哇。原来人家换新架构了,叫做DeepSeek Sparse Attention(一种稀疏注意力机制),记住这个名字就行,别管啥意思。就因为这个,现在人家的训练和推理成本又继续下降了一半多,效率也提高不少。另外还有开源了除CUDA之外的另一种算子,基于高级语言 TileLang开发的。你只要知道CUDA这玩意,可是NVIDIA公司能够在显卡领域称霸的基石,现在DeepSeek可以绕开CUDA,绕开NVIDIA显卡,也就是说,为国产片芯片大量适配大模型铺好路子了。未来,像什么华为、寒武纪、摩尔线程之类的国产GPU都可以快速接入DeepSeek。这可是大大的好事,具有国家级战略意义。再也不怕芯片卡脖子了。感谢DeepSeek又在布一个大局。这次的V3.2版本,并没有宣传在哪些生成能力上提高了,评测提高了啥的。有的只是换架构、成本再降、换底层算子。就像是围棋中下了一个妙手,虽然暂时还没看出啥效果,但是过阵子就会惊叹。“卧槽,原来那会的升级是多么深谋远虑呀!”
最后,在让我们来感受下DeepSeek-V3.2-Exp生成的“鸡排哥”介绍。
有时候觉得,DeepSeek跟鸡排哥又有些相似,都是坚持初心,回馈社会,坚持品质,终于赢得所有人的青睐。
生成的PPT截图:
#DeepSeek #DeepSeek-V3.2 #开源大模型 #深度求索 #鸡排哥