• Чохли на Apple iPhone 17 Pro Max
  • цены на Apple iPhone 17 Pro Max в Одессе

ChatGPT оставляет невидимые маркеры в тексте — как их найти и убрать

( 1 Оценка, среднее 5 из 5 )
Что будет в статье
  1. Эти знаки могут показать, что текст создан ИИ
  2. Что произошло
  3. Как найти непечатаемые символы в текстах ChatGPT
  4. Как удалить непечатаемые символы
  5. Ответы на популярные вопросы (7)
  6. Оцените автора (1)
Как обнаружить скрытые символы в тексте ChatGPT и быстро их удалить картинкаНевидимые Unicode-символы, неразрывные пробелы и экранированные знаки вроде $ или ~ могут выдать текст, созданный ChatGPT, даже если внешне он выглядит обычным. Проверить такой текст можно через специальные онлайн-инструменты или редакторы кода, а убрать лишние символы — через Google Docs, вставку без форматирования, поиск и замену или очистку в редакторе. Полностью полагаться на эти признаки не стоит, но внимательная проверка помогает быстро заметить машинные следы в тексте и привести его к нормальному виду.

Эти знаки могут показать, что текст создан ИИ

Что произошло

После обновления ChatGPT до GPT-5 во многих каналах о нейросетях и технологиях снова заговорили о так называемых невидимых маркерах, или «водяных знаках», в сгенерированных текстах. Имеются в виду непечатаемые символы Unicode: они видны только в редакторах с нужными настройками, а в интерфейсе ChatGPT или после публикации на сайте обычно никак не отображаются.

На самом деле история не новая. Ещё в начале года один из пользователей Reddit писал, что всё чаще замечает в текстах непечатаемый символ U+2019, которым нейросеть почему-то подменяла обычный апостроф (‘).

Тогда большого шума не случилось, но уже в апреле тему начали обсуждать буквально повсюду — после выхода GPT-o3 и GPT-o4 mini. В блоге платформы для интеграции ИИ Rumi появилась статья о том, что тексты новых моделей нередко содержат неразрывные пробелы Unicode U+A0, также известные как <0xa0>, и узкие неразрывные пробелы U+202F.

Символы Unicode, спрятанные в сгенерированном ИИ тексте

Такие символы могли встречаться где угодно: рядом с цифрами, аббревиатурами или вообще в случайных местах. Теоретически по ним можно было заподозрить, что текст написан ИИ. Из-за этого и началась тревога: неужели OpenAI сама решила помечать тексты, созданные нейросетью?

Как выяснилось, нет. Уже через три дня OpenAI устранила проблему, и обсуждение постепенно сошло на нет.

Но после релиза GPT-5 в августе, судя по сообщениям пользователей, узкие неразрывные пробелы будто бы появились снова — и старая паранойя вспыхнула с новой силой. Впрочем, даже если эти сообщения были правдивыми, проверить их сейчас сложно: похоже, OpenAI снова быстро всё исправила. 2 сентября нам не удалось заставить бота выдать неразрывные пробелы ни в кириллическом тексте, ни на английском. Зато обнаружилась другая странность: некоторые символы, например $ и ~, чат-бот записывает как \$ и \~. При этом в интерфейсе и обычных текстовых редакторах обратный слеш не виден, поэтому на первый взгляд всё выглядит нормально.

Экранирование символов в тексте ChatGPT

С Unicode этот невидимый обратный слеш уже не связан — здесь речь об экранировании символов. Поскольку ~ и $ могут иметь особое значение в языках программирования и разметке, перед ними иногда ставят \, чтобы система поняла: этот символ нужно просто вывести на экран, а не трактовать как часть команды. И вот это уже заметный сигнал для тех, кто внимательно проверяет текст. Очевидно, что человек при обычном письме не станет экранировать такие знаки.

В итоге даже если OpenAI закрывает отдельные лазейки, машинные следы в тексте всё равно можно найти без специальных знаний и сложных инструментов. Скорее всего, в любой версии модели внимательный человек сможет заметить странности в форматировании, но это не значит, что теперь нужно вручную перепечатывать каждый символ из страха перед скрытыми знаками.

Как найти непечатаемые символы в текстах ChatGPT

Для проверки можно использовать простой онлайн-инструмент от SoSci Survey. Работает он без лишних сложностей: вставляете текст в большое поле сверху и нажимаете Show me the characters. После этого непечатаемые Unicode-символы подсвечиваются фиолетовым цветом, включая те самые неразрывные пробелы, из-за которых поднялась шумиха.

Невидимые символы ChatGPT, подсвеченные SoSci Survey

Если материал набирал человек и он специально не добавлял Unicode-символы, фиолетовой подсветки в тексте быть не должно.

Непечатаемые знаки также можно увидеть в редакторах кода, например в VS Code или Sublime Text. Но есть нюанс: символ экранирования в таких редакторах обычно не подсвечивается, поэтому комбинация \~ может пройти мимо внимания. В этом случае лучше воспользоваться поиском по документу: нажать Ctrl + F или Cmd + F, а затем ввести нужную комбинацию в строку поиска.

Как удалить непечатаемые символы

Если лишних знаков всего несколько, проще всего убрать их вручную прямо в редакторе или заменить на обычный символ с клавиатуры. Но когда текст большой и таких элементов много, чистить его руками уже неудобно. Глаз быстро привыкает к картинке, и легко либо что-то пропустить, либо случайно удалить нужный фрагмент. В такой ситуации можно пойти несколькими путями.

  • Скопируйте текст из ChatGPT и вставьте его в новый Google-документ. После этого снова скопируйте материал из документа и проверьте, остались ли непечатаемые знаки. Если они всё ещё есть, вставьте текст в тот же документ или в другой редактор через Ctrl + Shift + V на Windows или Cmd + Shift + V на Mac. Такая вставка без форматирования часто убирает скрытые символы вместе с лишней разметкой.
  • Можно воспользоваться бесплатным веб-сервисом Humanize AI. Вставьте текст в левое поле, а очищенная версия появится справа и сразу попадёт в буфер обмена. В настройках при необходимости можно отключить Transform dashes и Transform quotes, чтобы не менять длинные тире и кавычки-ёлочки.
  • Ещё один вариант — инструмент поиска и замены в текстовом редакторе. Сначала найдите, какие именно символы встречаются в тексте, а затем по очереди задайте правила их замены. Например, можно заменить \~ на обычный ~. Такой способ подойдёт тем, кто хочет сохранить исходное форматирование как можно точнее и не доверяет автоматической очистке.
  • В редакторе кода можно выделить нужную комбинацию символов и нажать Alt + F3. Редактор подсветит все точные совпадения в файле. Затем достаточно нажать Del, чтобы удалить их сразу. Если в тексте есть другие похожие символы, действие можно повторить для каждой комбинации.

Это самые простые способы, для которых не нужны технические навыки. Если же вы хотя бы немного знакомы с программированием, можно использовать скрипт, который удаляет всё, кроме печатных символов. Такой скрипт легко попросить у того же ChatGPT, а решения для более редких случаев — например когда нужно убрать только часть непечатаемых знаков — можно поискать на Stack Overflow. Правда, для обычной чистки текста это уже почти как стрелять из пушки по воробьям.

Ответы на популярные вопросы

  • Какие символы могут выдать текст, написанный ИИ?

    Чаще всего внимание привлекают невидимые Unicode-символы: неразрывные пробелы, узкие неразрывные пробелы, необычные апострофы и экранированные знаки вроде $ или ~. В обычном редакторе они могут не бросаться в глаза, но при проверке становятся заметны.

  • Почему в текстах ChatGPT появляются непечатаемые символы?

    Обычно это связано не с намеренной маркировкой текста, а с особенностями генерации, форматирования и экранирования символов. Некоторые знаки имеют специальное значение в языках разметки или программирования, поэтому система может добавлять перед ними обратный слеш.

  • Можно ли по таким символам точно определить, что текст написал ИИ?

    Нет, на 100% полагаться на этот признак нельзя. Невидимые символы могут появиться и по другим причинам: из-за копирования текста, работы редактора, сайта или автоматической обработки. Но если таких знаков много и они стоят в странных местах, это повод проверить текст внимательнее.

  • Как проверить текст на скрытые Unicode-символы?

    Проще всего вставить текст в онлайн-инструмент для просмотра символов, например SoSci Survey, или открыть его в редакторе кода вроде VS Code или Sublime Text. Такие редакторы помогают увидеть часть непечатаемых знаков, которые не отображаются в обычном текстовом поле.

  • Как убрать непечатаемые символы из текста?

    Если символов мало, их можно удалить вручную или заменить через поиск. Для больших текстов удобнее вставить материал в Google Docs, затем скопировать его обратно через вставку без форматирования или использовать поиск и замену в редакторе.

  • Почему обратный слеш перед символами вроде $ и ~ считается подозрительным?

    Обычный человек при написании текста почти никогда не ставит обратный слеш перед такими символами. А вот для машинной обработки это привычный способ показать, что знак нужно вывести как обычный символ, а не выполнять как часть команды или разметки.

  • Нужно ли перепечатывать текст вручную, чтобы убрать следы ИИ?

    Нет, в этом обычно нет смысла. Достаточно проверить текст специальным инструментом, очистить форматирование, убрать лишние символы и перечитать материал глазами. В большинстве случаев этого хватает, чтобы текст выглядел аккуратно и естественно.

admin logo
Всем привет! В этом блоге мы выкладываем полезную информацию на тему Как обнаружить скрытые символы в тексте ChatGPT и быстро их удалить. Если у вас есть вопросы или идеи, которые мы не раскрыли в нашей статье - пишите об этом в комментариях.
Оцените автора
( 1 Оценка, среднее 5 из 5 )
Трихомонада: методы диагностики, когда нужно сдать анализКак мотивировать себя на перемены, если вас затянуло в «день сурка»
Новые посты
Популярные статьи