Компания Rumi обнаружила скрытые символы в текстах GPT-o3, но удалить их можно за несколько кликов
Компания OpenAI, разработавшая чат-бот ChatGPT, добавила невидимые водяные знаки в тексты, создаваемые новыми моделями GPT-o3 и GPT-4o-mini. Как выяснили специалисты из Rumi, это сделано для идентификации контента, сгенерированного ИИ, однако эффективность метода вызывает сомнения.
Исследователи обнаружили, что при формировании длинных текстов, например эссе, модели встраивают символ Unicode «Узкий пробел» (U+202F). Визуально он неотличим от обычного пробела, но отличается по ASCII-коду. Заметить такие знаки можно только с помощью специализированных инструментов: онлайн-анализаторов символов, редакторов кода (Sublime Text, VS Code) или текстовых анализаторов. Например, при копировании эссе, созданного GPT-o3, в этих программах отображается паттерн из NNBSP, который подтверждает происхождение текста.
OpenAI не анонсировала нововведение публично. Однако после апрельских утечек о тестировании водяных знаков для изображений компания Rumi провела собственный анализ. В ходе проверки выяснилось, что более ранние версии, включая GPT-4o, подобных маркеров не содержат.