这篇文章是使用常识篇的补充内容,专门聊一个很多人没有意识到的问题:你的预设,可能就是拖垮 AI 表现的元凶。
你的预设到底有多重
很多用户在设置预设的时候,心态是"越详细越好、越多越好"。尤其是在 SillyTavern(酒馆)这类工具里,世界书、角色卡、正则设定、作者注释,一层一层往上加,最后自己都不知道总共塞了多少东西进去。
有人说他的世界书有 57 条规则、15 万字。
我们算一笔账。15 万字中文大约等于 22 万到 30 万 token。而你还没开口说第一句话,这些内容就已经全部塞进了上下文里。
这意味着什么?
你用的如果是一个 128K 上下文的模型,光预设就已经吃掉了两倍多的上下文容量。模型直接装不下,要么报错要么被截断。
就算你用的是 200K 甚至百万上下文的模型,能装下了,但参考常识篇里讲的——能装下不等于能用好。模型在处理这么大体量的前置信息时,注意力被严重分散,大量细节会被忽略,核心设定反而可能被淹没在信息洪流里。
而且每一轮对话,这些预设内容都要被重新读一遍。你聊了 10 轮,这 15 万字就被重复处理了 10 次。费用可想而知。
多不等于好,反而更差
很多人的直觉是:我把设定写得越详细,AI 就越能理解我要什么,表现就越好。
实际上恰恰相反。
预设太多会导致几个问题:
第一,指令冲突。57 条规则里面,你能保证每一条和其他 56 条都不矛盾吗?人写到第 30 条的时候可能已经忘了第 5 条写的什么了。AI 读到互相矛盾的指令,就会在两个方向之间反复横跳,表现自然不稳定。
第二,重点被稀释。你最核心的设定可能只有 5 条,但它们被埋在了其他 52 条里面。AI 的注意力是有限的,当所有东西都被标记为"重要"的时候,就等于没有东西是重要的。
第三,模型被约束得太死。过度详细的规则会让 AI 变得畏手畏脚,输出变得生硬、模板化,反而丢失了自然感和创造力。你以为你在精确控制,实际上你在把 AI 捆成了粽子。
第四,费用爆炸。这个不用多解释了。
预设应该怎么控制
没有一个绝对的数字标准,但有一些实用的原则。
核心设定控制在 2000 到 4000 token 以内是比较健康的范围。这个量足够描述一个角色的性格、背景、说话风格、以及你对 AI 输出的基本要求了。
世界书和补充设定,能砍就砍。问自己一个问题:如果这条规则删掉了,AI 的表现会明显变差吗?如果答案是不会或者你不确定,那大概率可以删掉。
设定要分层。最核心的内容放在系统预设(system prompt)里,这是 AI 最先读到也最重视的部分。次要的补充信息放在世界书里,按需触发,不要全部常驻。无关紧要的细节就别写了,让 AI 自己发挥。
避免重复。很多人在角色卡里写了一遍性格,在世界书里又写了一遍,在系统预设里还写了一遍。三份内容说的是同一件事但措辞不同,AI 读到之后反而会困惑。说一遍就够了,放在最合适的位置。
一个简单的判断方法
如果你不确定自己的预设是不是太重了,做一个简单的测试。
打开一个新对话,只带你的预设,不输入任何内容,直接看 token 计数。大部分客户端都能显示当前上下文占用了多少 token。
如果你还没说第一句话,token 计数就已经过万了,你需要认真考虑砍一砍了。
如果已经过了 5 万,那基本上可以断定你的预设体量已经在严重影响模型表现了。
如果到了 15 万甚至更高,那你不是在和 AI 对话,你是在让 AI 每轮都读一本小说然后在剩余的一点注意力里回复你。效果能好才怪。
预设优化的思路
如果你已经有一套很庞大的预设,不知道从哪里下手精简,这里给几个方向。
第一步,去重。把所有预设内容放在一起通读一遍,找出重复描述的内容,只保留一份。
第二步,分级。把每一条设定标记为"必须有"、"最好有"、"有没有都行"三个级别。先只保留"必须有"的,测试效果。如果表现不错,那些"最好有"的就可以考虑不加了。
第三步,合并。有些分散的小规则可以合并成一条简洁的描述。比如你有 10 条规则都在描述角色的说话风格,完全可以合并成 2 到 3 句话概括。
第四步,测试。每次精简之后都测试一下效果。你会发现很多时候砍掉一大半预设之后,AI 的表现不但没变差反而变好了——因为它终于能把注意力集中在真正重要的设定上了。
当然,这些优化工作你也可以让 AI 来帮你做。把你的预设内容贴给一个干净的 AI 对话(比如 ChatBox 网页版),让它帮你找出重复项、矛盾点、以及可以精简的部分。具体怎么操作,下一篇文章会详细讲。
写在最后
预设是给 AI 的工作说明书,不是百科全书。
一份好的说明书应该是简洁、清晰、重点突出的。你见过哪个公司给新员工的入职说明书写 15 万字的?写了他也记不住,记住了也不知道该先执行哪条。
AI 也是一样。告诉它最重要的事情,剩下的让它自己发挥。这才是预设应该有的样子。