史东读老书:不得不说,语文最难学!

跟着上文的背景,写一段小品文。

网上最近很多测试大模型能力的文章,还有好多分析大模型、小模型、高精度、量化对比的测试。

几乎没有看到基于Transformer原理进行的测试,要么就是哪个什么分数比一比,要么就弄个贴吧的啥啥,要么就来个脑经急转弯,要么来个数学题。

如果理解了Transformer的基本原理,就知道这个玩意是基于参数权值开展工作的,模型的能力大小就要看这个权值能够有效工作的长度。

  1. 理解加减法、逻辑与非的权值不需要很长,学会了就是学会了。
  2. 罗里吧嗦写个小说,写个故事,基本上记住的故事概要,凑字就行,难度不大。

最难的是背文章。
14b,低精度,你让他试试《出师表》、《赤壁赋》,如果能通过,你让他试试《荷塘月色》,要不前后《赤壁赋》一次背完!!!

到此为止了,至于为什么对于GPT来说背长篇古文不易,懂得都懂。
——此文一出,那些到处搬运抄袭GPT测试的博主,到底懂不懂也就那啥。。。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容