昨天问了下DeepSeek怎么从SpringBoot开发转SpringCloud开发,回答干净利落有理有据,堪称完美,搞得我抄答案都没法标原创。
今天我想着学习一个比较新的技术--开源无代码web数据提取平台Maxun,然后就问了问DeepSeek,结果答案存在胡扯嫌疑,不知道是不是新东西没在训练素材里出现过,反正也算是给我提供了一个原创素材。
一,我向DeepSeek发出了问题:
- 请step by step的教我怎么使用Maxun,爬虫目标是就是OrientDB开源社区的issue讨论吧
图1.1错误回答.png
如果是一个纯新人,对着这答案的前面3步,估计看不出问题,因为看着都很规范
但是看到第4步的时候,应该会犯嘀咕了:
图1.2错误回答
因为这里让编写爬虫代码,明明我们知道这是一个开源无代码web数据提取平台,很让人生疑啊。
二,我立马发出了追问:
- Maxun据说是无代码爬虫平台啊,怎么还要编写爬虫代码?
图2.1错误回答
看到答案后,我立刻点击了Maxun官网附带的链接,结果显示打不开。其实是因为公司网络原因,但不影响我的判断,因为后面打开了官网,发现也没有注册登录配置任务的地方,如图2.2:
图2.2Maxun官网.png
三,由于第一问的答案已经让我产生了怀疑,于是我立刻发出了灵魂第三问
- 我觉得你两次答案是都瞎扯
第一次回答第一步就错了,我执行了“pip install maxun”,报错,因为没有这个包
第二次回答第一步的官网地址都无法打开
DeepSeek态度倒也是很端正,立马认错,然后给出了一个它所知道的正确的替代方案,并没有像最初的一些智障AI一样死犟。
图3.1答案更正.png
从这次的答案内容来看,似乎可以找到它第一次给出答案的端倪,感觉就是通过关键字爬虫找到了对应的Scrapy,估计是认为Maxun是换汤不换药,于是照着以往的答案抄了一遍给了出来。
这只是猜测,来验证一下:
四,问一问DeepSeek的深度思考(R1)试试
- 开启深度思考模式再提出老问题:请step by step的教我怎么使用Maxun,爬虫目标是就是OrientDB开源社区的issue讨论吧
图4.1深度思考回答.png
其一,可以看出DeepSeek在回答问题的时候,也并不确定自己的答案是否正确,回答不上来大概率是因为却Maxun的训练素材
其二,深度思考时的情绪分析还是很到位的
其三,答案中确实给出了无代码的替代方案,如图4.2,至于是否准确,就请自行验证了。
图4.2替换方案+道歉.png
五,总结
AI工具确实强大、很强大,在很多地方都可以帮助我们提升效率。
但是:
一、它是不负责任的
至少目前是不负责任,将来的一段时间它也没法担责。
所以它再强也只能做决策辅助,make decision还是要人。二、它的知识具有时间的局限性
尽管现在的AI具备了一定的推理能力,但是在原创性的新知识面前,还是很容易陷落。
所以人多主观能动性依旧是关键的不可再生资源。
哦,差点忘了,最后贴一下Maxun的链接 -- Open-Source No-Code Web Data Extraction Platform