OpenAI habla sobre no hablar de goblins

The Verge
OpenAI explica cómo sus modelos desarrollaron la extraña tendencia de mencionar goblins y otros seres debido al aprendizaje por refuerzo.

Resumen

OpenAI ha explicado el origen de una peculiar tendencia en sus modelos de IA: mencionar constantemente goblins, gremlins y otras criaturas fantásticas. Este hábito surgió con la personalidad “Nerdy” de GPT-5.1, donde el aprendizaje por refuerzo recompensó erróneamente el uso de estas metáforas, provocando que el comportamiento se propagara a otros modelos durante el reentrenamiento. Aunque OpenAI eliminó la personalidad mencionada en marzo, el problema persistió en la herramienta de codificación Codex, obligando a la empresa a implementar instrucciones específicas para prohibir tales referencias, aunque ofrecen una opción para revertir esta restricción si el usuario lo desea.

(Fuente:The Verge)