Диплом не сгенерировать — ChatGPT оставляет "метки" в текстах

Сайт OpenAI со страницей ChatGPT на экране ноутбука. Фото: Unsplash

Команда платформы Rumi обнаружила, что новейшие модели OpenAI — GPT-o3 и GPT-o4 mini — незаметно вставляют в сгенерированный текст специальные символы-"отметки". Они напоминают обычные пробелы, однако имеют другие коды Unicode и тем самым могут свидетельствовать о машинном происхождении материала. Удалить такие маркеры несложно, поэтому, вероятно, это лишь краткосрочный эксперимент, а не постоянный инструмент проверки авторства.

Об этом пишет Rumi.

Какие отметки оставляет ChatGPT в сгенерированных им текстах

В Rumi отмечают, что скрытые символы появляются только в длинных ответах, например, когда GPT-o3 просят написать "полное эссе". Речь идет преимущественно о Narrow No-Break Space (NNBSP, код U+202F), который выглядит как обычный пробел, но имеет отличную ASCII-последовательность. В более старых версиях, в частности GPT-4o, такой водяной метки не зафиксировано.

Проверить наличие маркеров можно, скопировав текст в онлайн-просмотрщик символов или открыв его в редакторе вроде Sublime Text, отображающем невидимые символы. Схема появления NNBSP представляется системной, а не случайной, поэтому специалисты предполагают преднамеренную реализацию.

"Водяные знаки" в текстах, сгенерированных ChatGPT. Фото: Rumi

В то же время отметки сохраняются после копирования в документы Google Docs и подобные редакторы, поэтому преподаватели или работодатели потенциально могут обнаружить "невидимый" след, если студент или автор будет полностью копировать ответы из ChatGPT. Удалить маркеры просто: достаточно заменить специальные символы обычными пробелами с помощью функции "Найти и заменить" в текстовом редакторе.

В Rumi считают, что скрытые символы-метки не станут надежным долгосрочным методом проверки. Вместо этого они предлагают сосредоточиться на процесс-ориентированном подходе к письму: отслеживать развитие идей в нескольких черновиках, привлекать ИИ-инструменты во время работы над заданием и фиксировать этапы творческого процесса. Такой формат, по их мнению, эффективнее поддерживает добропорядочность и формирует ИИ-грамотность студентов.

Напомним, что OpenAI каждый раз теряет деньги, когда вы добавляете к запросу ChatGPT "пожалуйста" или "спасибо". Как оказалось, вежливость с чат-ботом потребляет чуть больше электричества, что стоило компании уже десятки миллионов долларов.

Также мы писали, что ChatGPT получил существенное обновление памяти, которое позволит ему анализировать все предыдущие диалоги с пользователем. Чат-бот способен учитывать контекст из прошлых разговоров.