这篇内容其实昨天就想发,但是扒拉一下草稿箱,发现有存货就懒了一下
不知道大家关注了吗,国产通义千问推出了MOE 架构的Qwen2.5-max,登上某大模型盲测榜单全球前十,超越了 Claude-3.5-Sonnet、GPT-4o、DeepSeek-V3 等一众模型。需要注意的是,这是让网友每次对两个模型进行盲测的榜单,因此,是一份真人体验得出的结果,有很强的参考意义。
Openai真的是压力满满,鹰酱的技术领先地位摇摇欲坠啊。
不知道又是让鹰酱多少个失眠的夜晚~哈哈
话不多说,我们来实测。
有两种测试途径,一种是webUI,一种是API
我们先测试webUI
网址:
https://chat.qwenlm.ai/
我们先注册一下。右上角。填写完邮箱,需要激活,整个业务流程很简洁。
激活完成后自动进入对话界面。
实际体验
数据返回是非常迅速的,因为不是推理模型,没了思考的过程,整体给我感觉就是返回速度是真快!
数学题:
语文题:
文案能力:
代码能力:
测试,UI设计的OK,但是代码实际是跑不起来的
JS按钮点击逻辑是有问题的,且没有提供游戏核心的部分。
但是,已经不错了。
绘画能力:
这里可以调整图片比例,等待时间稍微有点长。
没有太多的限定,生成的图片质量还不错,能用。
midjourney.com找的图和提示词
Qwen输出
大家看看这输出质量怎么样?
通过api体验,官网地址:
https://www.aliyun.com/product/bailian
注册了一个新账号,果然会有福利
老用户与狗,嗨!没有没有,我爱阿里
先试一下API调用,这里因为意外关机,操作流程可能和新用户略有不同
我这里没点上,后面是通过顶部的广告开通的,流程差不多,大家可以随机应变一下。
主推的模型就是Max
这里有一些介绍,先看看
好的,我这里选择开通
提供了webUI,右上角有API的选项
我们开通一下API
点击查看可以看到你的API
下面我们对接还是用Cherry Studio
下载安装使用可以看我前几天的推文,常规设置一下API和模型,就可以使用了。别忘了右上角的开通。
切换模型后,测试一下对话能力
吐槽一下,官方对名称这块搞的有点乱,查了半天也是迷迷糊糊的。
我就选择了最新的max
回复的速度是真快,质量也是很高的,虽然没有联网能力,但是看官方预留了接口,说明只是没有放出来而已。总结一下,MOE架构的Qwen2.5-MAX在我实测过程中,反应迅速,对问题都能及时给予高质量的反馈,在实际体验中如果打分我可以给到8.5分。虽然是成功对接了,但是,训练的数据时间还是24年12月,2个月过去了,最新版本的qwen2.5能力一定会有更多让人惊喜的地方,我看了一些Qwen3 的文章,在视觉,数学,音频方面提升是非常大的,看了之后真是挺提气的,看到我们国产大模型能持续的发展,不断突破,涌现出这么多杰出的工程师和伟大的公司,真心让我感到了我们国家在强大,一股子身为中华儿女的自豪感油然而生!