GPT生成的文章总会有股很浓的AI味,如何去除AI味变成了一项非常有意思的研究,这里分享一下前段时间的一些研究结果。
什么是AI味?
想要更好的去AI味,那首先必须明白,什么是AI味。很多时候这都是一种只可意会不可言传的东西,但是我们要去AI味那就必须搞清楚AI味的来源。
常用词差异
首先最明显的就是常用词差异。
知名论坛 Reddit 上有网友发出了一个常用词差异文章,其中臭名昭著的 Delved 以超过人类使用频率 300 倍而记录在案。差距最高的 reimagined 以 1000 倍人类使用频率荣登榜首。
毫无疑问,因为固定训练语料的问题,导致某些词被 GPT 偏爱而大面积使用是目前AI味的重要来源。虽然我们大部分人不是英语母语人士,但是看多了 GPT 输出的内容后,也能一眼就能看出来浓浓的AI味。
而目前主流的去AI味的网站也把常用词替换作为去AI味的重要手段。随便搜一些网站,使用后就能看到几乎百分百会把 Delved 这个词给替换成其他同义词。
所以去除AI味的第一步,就是找到AI高频使用的词汇,并加以替换成其他同义词。
当然了,高频词汇并不是那么好搜集,并且很多时候你还要对比着人类的输出内容来进行频率上的判断,并不是你拿着GPT输出的内容一顿统计后就能完美解决。当然,很多时候我们并非追求100%,只要你开始去统计这些内容并针对性的进行替换后,就会有立竿见影的效果。
常用句式结构
The early morning air was crisp as I walked into the sleek, glass-walled office of KPMG for the first time.
I had been chosen to participate in a comprehensive financial analysis project, an opportunity that promised to sharpen my skills and broaden my understanding of the auditing world.
That moment, standing in the brightly lit conference room, the cityscape visible through the floor-to-ceiling windows behind me, filled me with a sense of accomplishment and purpose. It was a testament to the power of diligence and analytical thinking, qualities that are crucial in the field of auditing.
先来看看一些AI输出的经典句式。
说实话,当我拿着上面这些内容给老板审阅时,我的十个脚指头已经紧张的蜷缩在了一起。真的太尴尬了,尤其是最后一段那种积极向上的总结和外向拓展,我真的几乎在每一篇AI生成的内容中见到过。
(当然,不同领域和目的的文章,常见内容会不太一样。)
这里总结一下。
- AI特别喜欢使用“这一刻” “那是一个特别的日子” “我记得那天天气明媚” 作为起手式,衔接一个场景描述作为过渡内容,然后打出一招场景与心境互相配合的掌法,最后上升价值作为终结技结束连招。
- AI特别喜欢使用倒装。“房间里只有沙沙的声音,那是人们翻动书本的力量” “我来到了一个游乐园,这里充满孩童的欢笑,是治愈我内心的良方”。
当然,我总结的内容只是某一方面,更多的还需要大家来进行补充。
针对这些常见的句式结构,我观察了很多 Humanizer 网站,都没有经过特别的处理,并且同样的句式经过了网站的优化后,居然神奇的能在检测网站上通过。这些是我觉得目前检测网站并没有做好的地方,合理猜测,目前的检测应该还是基于第一部分,即常用词上,进行的检测,并没有深入到句式理解上。
就我自己来说
- 首先我禁用了起手式,严格规定AI必须以细节场景为开头,然后让AI不要动不动就进行总结,算是禁用了终结技。不过诚实的讲,依然存在比较浓的AI味。
- 这里我尝试过让AI不用倒装句,但是效果不好,所以最后给了例子进去,发现这样的输出变少了,但是依旧不能消灭,只能说就阅读感受来说好很多了。
总结
以上就是目前我自己去除AI味的办法。
其中替换常用词的方法,最好结合不同的模型进行输出,比如我自己,初始文章是使用 GPT4o 输出的,优化文章是使用的 Claude3.5 输出的。目前来说主流的检测网站,如zerogpt.com,测试下来,基本上AI率都下降到了10%以下。
想要常见 AI 词表的同学,点个关注,并进行评论。