У ChatGPT випадково з’явився «режим гобліна»: OpenAI пояснила дивну поведінку бота.

Компанія OpenAI повідомила про незвичний збій у роботі мовних моделей серії ChatGPT: чатбот почав значно частіше використовувати у відповідях слова «гобліни», «гремліни» та інші фантазійні образи. Про проблему розробники розповіли у своєму офіційному блозі.
Після запуску GPT-5.1 користувачі звернули увагу на те, що відповіді бота стали занадто фамільярними та насиченими дивними метафорами. Аналіз показав, що кількість згадок про «гоблінів» зросла на 175%, а про «гремлінів» — більш ніж наполовину. Спочатку це не вважали серйозною помилкою, однак згодом така манера спілкування почала проявлятися дедалі частіше.
У компанії пояснили, що джерелом проблеми стала система «особистостей» для ChatGPT, які користувачі могли обирати для спілкування. Найбільше це стосувалося стилю Nerdy — своєрідного «ботаніка». Хоча цей режим використовувався лише у невеликій частині відповідей, саме він став причиною більшості згадок про вигаданих істот.
За словами розробників, під час тренування Nerdy-версії моделі їй ненавмисно надали занадто високий пріоритет для використання фантазійних метафор. У результаті виник ефект «замкненого кола»: модель отримувала позитивне підкріплення за такий стиль, а подібні приклади повторно потрапляли до навчальних даних, ще більше закріплюючи цю особливість.
Після виявлення причин OpenAI у березні відмовилася від особистості Nerdy, а також оновила підхід до навчання моделей. Крім того, з навчальних наборів даних прибрали надмірну кількість текстів із подібними метафорами.
Мітки: безпечний інтернет, штучний інтелект