Главная
Блог
Технологии
ChatGPT оставляет невидимые маркеры в тексте — как их найти и убрать

ChatGPT оставляет невидимые маркеры в тексте — как их найти и убрать

Автор

rest.lviv.ua

На чтение

6 мин

Просмотров

209

Обновлено

15.06.2026

( 1 Оценка, среднее 5 из 5 )

Что будет в статье

Эти знаки могут показать, что текст создан ИИ
Что произошло
Как найти непечатаемые символы в текстах ChatGPT
Как удалить непечатаемые символы
Ответы на популярные вопросы (7)
Оцените автора (1)

Как обнаружить скрытые символы в тексте ChatGPT и быстро их удалить картинка

Невидимые Unicode-символы, неразрывные пробелы и экранированные знаки вроде $ или ~ могут выдать текст, созданный ChatGPT, даже если внешне он выглядит обычным. Проверить такой текст можно через специальные онлайн-инструменты или редакторы кода, а убрать лишние символы — через Google Docs, вставку без форматирования, поиск и замену или очистку в редакторе. Полностью полагаться на эти признаки не стоит, но внимательная проверка помогает быстро заметить машинные следы в тексте и привести его к нормальному виду.

Итак, Как обнаружить скрытые символы в тексте ChatGPT и быстро их удалить - далее в нашей статье

Эти знаки могут показать, что текст создан ИИ

Что произошло

После обновления ChatGPT до GPT-5 во многих каналах о нейросетях и технологиях снова заговорили о так называемых невидимых маркерах, или «водяных знаках», в сгенерированных текстах. Имеются в виду непечатаемые символы Unicode: они видны только в редакторах с нужными настройками, а в интерфейсе ChatGPT или после публикации на сайте обычно никак не отображаются.

На самом деле история не новая. Ещё в начале года один из пользователей Reddit писал, что всё чаще замечает в текстах непечатаемый символ U+2019, которым нейросеть почему-то подменяла обычный апостроф (‘).

Тогда большого шума не случилось, но уже в апреле тему начали обсуждать буквально повсюду — после выхода GPT-o3 и GPT-o4 mini. В блоге платформы для интеграции ИИ Rumi появилась статья о том, что тексты новых моделей нередко содержат неразрывные пробелы Unicode U+A0, также известные как <0xa0>, и узкие неразрывные пробелы U+202F.

Символы Unicode, спрятанные в сгенерированном ИИ тексте

Такие символы могли встречаться где угодно: рядом с цифрами, аббревиатурами или вообще в случайных местах. Теоретически по ним можно было заподозрить, что текст написан ИИ. Из-за этого и началась тревога: неужели OpenAI сама решила помечать тексты, созданные нейросетью?

Как выяснилось, нет. Уже через три дня OpenAI устранила проблему, и обсуждение постепенно сошло на нет.

Но после релиза GPT-5 в августе, судя по сообщениям пользователей, узкие неразрывные пробелы будто бы появились снова — и старая паранойя вспыхнула с новой силой. Впрочем, даже если эти сообщения были правдивыми, проверить их сейчас сложно: похоже, OpenAI снова быстро всё исправила. 2 сентября нам не удалось заставить бота выдать неразрывные пробелы ни в кириллическом тексте, ни на английском. Зато обнаружилась другая странность: некоторые символы, например $ и ~, чат-бот записывает как \$ и \~. При этом в интерфейсе и обычных текстовых редакторах обратный слеш не виден, поэтому на первый взгляд всё выглядит нормально.

Экранирование символов в тексте ChatGPT

С Unicode этот невидимый обратный слеш уже не связан — здесь речь об экранировании символов. Поскольку ~ и $ могут иметь особое значение в языках программирования и разметке, перед ними иногда ставят \, чтобы система поняла: этот символ нужно просто вывести на экран, а не трактовать как часть команды. И вот это уже заметный сигнал для тех, кто внимательно проверяет текст. Очевидно, что человек при обычном письме не станет экранировать такие знаки.

В итоге даже если OpenAI закрывает отдельные лазейки, машинные следы в тексте всё равно можно найти без специальных знаний и сложных инструментов. Скорее всего, в любой версии модели внимательный человек сможет заметить странности в форматировании, но это не значит, что теперь нужно вручную перепечатывать каждый символ из страха перед скрытыми знаками.

Как найти непечатаемые символы в текстах ChatGPT

Для проверки можно использовать простой онлайн-инструмент от SoSci Survey. Работает он без лишних сложностей: вставляете текст в большое поле сверху и нажимаете Show me the characters. После этого непечатаемые Unicode-символы подсвечиваются фиолетовым цветом, включая те самые неразрывные пробелы, из-за которых поднялась шумиха.

Невидимые символы ChatGPT, подсвеченные SoSci Survey

Если материал набирал человек и он специально не добавлял Unicode-символы, фиолетовой подсветки в тексте быть не должно.

Непечатаемые знаки также можно увидеть в редакторах кода, например в VS Code или Sublime Text. Но есть нюанс: символ экранирования в таких редакторах обычно не подсвечивается, поэтому комбинация \~ может пройти мимо внимания. В этом случае лучше воспользоваться поиском по документу: нажать Ctrl + F или Cmd + F, а затем ввести нужную комбинацию в строку поиска.

Как удалить непечатаемые символы

Если лишних знаков всего несколько, проще всего убрать их вручную прямо в редакторе или заменить на обычный символ с клавиатуры. Но когда текст большой и таких элементов много, чистить его руками уже неудобно. Глаз быстро привыкает к картинке, и легко либо что-то пропустить, либо случайно удалить нужный фрагмент. В такой ситуации можно пойти несколькими путями.

Скопируйте текст из ChatGPT и вставьте его в новый Google-документ. После этого снова скопируйте материал из документа и проверьте, остались ли непечатаемые знаки. Если они всё ещё есть, вставьте текст в тот же документ или в другой редактор через Ctrl + Shift + V на Windows или Cmd + Shift + V на Mac. Такая вставка без форматирования часто убирает скрытые символы вместе с лишней разметкой.
Можно воспользоваться бесплатным веб-сервисом Humanize AI. Вставьте текст в левое поле, а очищенная версия появится справа и сразу попадёт в буфер обмена. В настройках при необходимости можно отключить Transform dashes и Transform quotes, чтобы не менять длинные тире и кавычки-ёлочки.
Ещё один вариант — инструмент поиска и замены в текстовом редакторе. Сначала найдите, какие именно символы встречаются в тексте, а затем по очереди задайте правила их замены. Например, можно заменить \~ на обычный ~. Такой способ подойдёт тем, кто хочет сохранить исходное форматирование как можно точнее и не доверяет автоматической очистке.
В редакторе кода можно выделить нужную комбинацию символов и нажать Alt + F3. Редактор подсветит все точные совпадения в файле. Затем достаточно нажать Del, чтобы удалить их сразу. Если в тексте есть другие похожие символы, действие можно повторить для каждой комбинации.

Это самые простые способы, для которых не нужны технические навыки. Если же вы хотя бы немного знакомы с программированием, можно использовать скрипт, который удаляет всё, кроме печатных символов. Такой скрипт легко попросить у того же ChatGPT, а решения для более редких случаев — например когда нужно убрать только часть непечатаемых знаков — можно поискать на Stack Overflow. Правда, для обычной чистки текста это уже почти как стрелять из пушки по воробьям.

Ответы на популярные вопросы

Какие символы могут выдать текст, написанный ИИ?
Чаще всего внимание привлекают невидимые Unicode-символы: неразрывные пробелы, узкие неразрывные пробелы, необычные апострофы и экранированные знаки вроде $ или ~. В обычном редакторе они могут не бросаться в глаза, но при проверке становятся заметны.
Почему в текстах ChatGPT появляются непечатаемые символы?
Обычно это связано не с намеренной маркировкой текста, а с особенностями генерации, форматирования и экранирования символов. Некоторые знаки имеют специальное значение в языках разметки или программирования, поэтому система может добавлять перед ними обратный слеш.
Можно ли по таким символам точно определить, что текст написал ИИ?
Нет, на 100% полагаться на этот признак нельзя. Невидимые символы могут появиться и по другим причинам: из-за копирования текста, работы редактора, сайта или автоматической обработки. Но если таких знаков много и они стоят в странных местах, это повод проверить текст внимательнее.
Как проверить текст на скрытые Unicode-символы?
Проще всего вставить текст в онлайн-инструмент для просмотра символов, например SoSci Survey, или открыть его в редакторе кода вроде VS Code или Sublime Text. Такие редакторы помогают увидеть часть непечатаемых знаков, которые не отображаются в обычном текстовом поле.
Как убрать непечатаемые символы из текста?
Если символов мало, их можно удалить вручную или заменить через поиск. Для больших текстов удобнее вставить материал в Google Docs, затем скопировать его обратно через вставку без форматирования или использовать поиск и замену в редакторе.
Почему обратный слеш перед символами вроде $ и ~ считается подозрительным?
Обычный человек при написании текста почти никогда не ставит обратный слеш перед такими символами. А вот для машинной обработки это привычный способ показать, что знак нужно вывести как обычный символ, а не выполнять как часть команды или разметки.
Нужно ли перепечатывать текст вручную, чтобы убрать следы ИИ?
Нет, в этом обычно нет смысла. Достаточно проверить текст специальным инструментом, очистить форматирование, убрать лишние символы и перечитать материал глазами. В большинстве случаев этого хватает, чтобы текст выглядел аккуратно и естественно.

Всем привет! В этом блоге мы выкладываем полезную информацию на тему Как обнаружить скрытые символы в тексте ChatGPT и быстро их удалить. Если у вас есть вопросы или идеи, которые мы не раскрыли в нашей статье - пишите об этом в комментариях.

Оцените автора

( 1 Оценка, среднее 5 из 5 )

Трихомонада: методы диагностики, когда нужно сдать анализ Как мотивировать себя на перемены, если вас затянуло в «день сурка»

Разместить статью

Новые посты