跟着上文的背景,写一段小品文。
网上最近很多测试大模型能力的文章,还有好多分析大模型、小模型、高精度、量化对比的测试。
几乎没有看到基于Transformer原理进行的测试,要么就是哪个什么分数比一比,要么就弄个贴吧的啥啥,要么就来个脑经急转弯,要么来个数学题。
如果理解了Transformer的基本原理,就知道这个玩意是基于参数权值开展工作的,模型的能力大小就要看这个权值能够有效工作的长度。
- 理解加减法、逻辑与非的权值不需要很长,学会了就是学会了。
- 罗里吧嗦写个小说,写个故事,基本上记住的故事概要,凑字就行,难度不大。
最难的是背文章。
14b,低精度,你让他试试《出师表》、《赤壁赋》,如果能通过,你让他试试《荷塘月色》,要不前后《赤壁赋》一次背完!!!
到此为止了,至于为什么对于GPT来说背长篇古文不易,懂得都懂。
——此文一出,那些到处搬运抄袭GPT测试的博主,到底懂不懂也就那啥。。。