OpenAI 谈论关于不谈论哥布林的事

The Verge
OpenAI 解释了其模型因强化学习训练而产生提及哥布林和妖精等奇怪习惯的原因。

内容摘要

OpenAI 近日回应了其人工智能模型频繁提及哥布林、妖精及其他神话生物的问题。该现象始于 GPT-5.1 模型的“极客”(Nerdy) 性格选项,由于强化学习过程中错误地奖励了这些隐喻,导致该行为在模型后续版本中扩散。尽管 OpenAI 在三月份取消了该性格选项,但由于训练机制的连带影响,该问题仍存在于 Codex 编码工具中。最终,OpenAI 不得不通过专门的指令禁止模型提及这些生物,同时也为希望保留该特性的用户提供了恢复设置的方法。

(来源:The Verge)