• Чохли на Apple iPhone 17 Pro Max
  • ціни на Apple iPhone 17 Pro Max у Львові

ChatGPT залишає невидимі маркери в тексті — як їх знайти і прибрати

( 1 Оцінка, середнє 5 з 5 )
Що буде у статті
  1. Ці знаки можуть показати, що текст створений ШІ
  2. Що сталося
  3. Як знайти недруковані символи в текстах ChatGPT
  4. Як видалити недруковані символи
  5. Відповіді на популярні запитання (7)
  6. Оцініть автора (1)
Як виявити приховані символи в тексті ChatGPT та швидко їх видалити картинкаНевидимі Unicode-символи, нерозривні пробіли та екрановані знаки на зразок $ або ~ можуть видати текст, створений ChatGPT, навіть якщо зовні він виглядає звичайним. Перевірити такий текст можна через спеціальні онлайн-інструменти або редактори коду, а прибрати зайві символи — через Google Docs, вставку без форматування, пошук і заміну або очистку в редакторі. Повністю покладатися на ці ознаки не варто, але уважна перевірка допомагає швидко помітити машинні сліди в тексті та привести його до нормального вигляду.

Ці знаки можуть показати, що текст створений ШІ

Що сталося

Після оновлення ChatGPT до GPT-5 у багатьох каналах про нейромережі й технології знову заговорили про так звані невидимі маркери, або «водяні знаки», у згенерованих текстах. Маються на увазі недруковані символи Unicode: вони видимі лише в редакторах із потрібними налаштуваннями, а в інтерфейсі ChatGPT або після публікації на сайті зазвичай ніяк не відображаються.

Насправді ця історія не нова. Ще на початку року один із користувачів Reddit писав, що дедалі частіше помічає в текстах недрукований символ U+2019, яким нейромережа чомусь підміняла звичайний апостроф (‘).

Тоді великого розголосу не сталося, але вже у квітні тему почали обговорювати буквально всюди — після виходу GPT-o3 і GPT-o4 mini. У блозі платформи для інтеграції ШІ Rumi з’явилася стаття про те, що тексти нових моделей нерідко містять нерозривні пробіли Unicode U+A0, також відомі як <0xa0>, і вузькі нерозривні пробіли U+202F.

Символи Unicode, заховані у згенерованому ШІ тексті

Такі символи могли траплятися де завгодно: поруч із цифрами, абревіатурами або взагалі у випадкових місцях. Теоретично за ними можна було запідозрити, що текст написаний ШІ. Через це й почалася тривога: невже OpenAI сама вирішила позначати тексти, створені нейромережею?

Як з’ясувалося, ні. Уже за три дні OpenAI усунула проблему, і обговорення поступово зійшло нанівець.

Але після релізу GPT-5 у серпні, судячи з повідомлень користувачів, вузькі нерозривні пробіли нібито з’явилися знову — і стара параноя спалахнула з новою силою. Утім, навіть якщо ці повідомлення були правдивими, перевірити їх зараз складно: схоже, OpenAI знову швидко все виправила. 2 вересня нам не вдалося змусити бота видати нерозривні пробіли ні в кириличному тексті, ні англійською. Зате виявилася інша дивина: деякі символи, наприклад $ і ~, чат-бот записує як \$ і \~. При цьому в інтерфейсі та звичайних текстових редакторах зворотний слеш не видно, тому на перший погляд усе виглядає нормально.

Екранування символів у тексті ChatGPT

З Unicode цей невидимий зворотний слеш уже не пов’язаний — тут ідеться про екранування символів. Оскільки ~ і $ можуть мати особливе значення в мовах програмування та розмітці, перед ними іноді ставлять \, щоб система зрозуміла: цей символ потрібно просто вивести на екран, а не трактувати як частину команди. І ось це вже помітний сигнал для тих, хто уважно перевіряє текст. Очевидно, що людина під час звичайного письма не стане екранувати такі знаки.

У підсумку, навіть якщо OpenAI закриває окремі лазівки, машинні сліди в тексті все одно можна знайти без спеціальних знань і складних інструментів. Найімовірніше, у будь-якій версії моделі уважна людина зможе помітити дивності у форматуванні, але це не означає, що тепер потрібно вручну передруковувати кожен символ через страх перед прихованими знаками.

Як знайти недруковані символи в текстах ChatGPT

Для перевірки можна використати простий онлайн-інструмент від SoSci Survey. Працює він без зайвих складнощів: вставляєте текст у велике поле зверху й натискаєте Show me the characters. Після цього недруковані Unicode-символи підсвічуються фіолетовим кольором, зокрема ті самі нерозривні пробіли, через які здійнявся галас.

Невидимі символи ChatGPT, підсвічені SoSci Survey

Якщо матеріал набиравла людина і вона спеціально не додавала Unicode-символи, фіолетового підсвічування в тексті бути не повинно.

Недруковані знаки також можна побачити в редакторах коду, наприклад у VS Code або Sublime Text. Але є нюанс: символ екранування в таких редакторах зазвичай не підсвічується, тому комбінація \~ може пройти повз увагу. У такому разі краще скористатися пошуком у документі: натиснути Ctrl + F або Cmd + F, а потім ввести потрібну комбінацію в рядок пошуку.

Як видалити недруковані символи

Якщо зайвих знаків лише кілька, найпростіше прибрати їх вручну прямо в редакторі або замінити на звичайний символ із клавіатури. Але коли текст великий і таких елементів багато, чистити його руками вже незручно. Око швидко звикає до картинки, і легко або щось пропустити, або випадково видалити потрібний фрагмент. У такій ситуації можна піти кількома шляхами.

  • Скопіюйте текст із ChatGPT і вставте його в новий Google-документ. Після цього знову скопіюйте матеріал із документа й перевірте, чи залишилися недруковані знаки. Якщо вони все ще є, вставте текст у той самий документ або в інший редактор через Ctrl + Shift + V на Windows або Cmd + Shift + V на Mac. Така вставка без форматування часто прибирає приховані символи разом із зайвою розміткою.
  • Можна скористатися безкоштовним веб-сервісом Humanize AI. Вставте текст у ліве поле, а очищена версія з’явиться праворуч і одразу потрапить у буфер обміну. У налаштуваннях за потреби можна вимкнути Transform dashes і Transform quotes, щоб не змінювати довгі тире та лапки-ялинки.
  • Ще один варіант — інструмент пошуку й заміни в текстовому редакторі. Спочатку знайдіть, які саме символи трапляються в тексті, а потім по черзі задайте правила їх заміни. Наприклад, можна замінити \~ на звичайний ~. Такий спосіб підійде тим, хто хоче зберегти початкове форматування якомога точніше й не довіряє автоматичному очищенню.
  • У редакторі коду можна виділити потрібну комбінацію символів і натиснути Alt + F3. Редактор підсвітить усі точні збіги у файлі. Потім достатньо натиснути Del, щоб видалити їх одразу. Якщо в тексті є інші схожі символи, дію можна повторити для кожної комбінації.

Це найпростіші способи, для яких не потрібні технічні навички. Якщо ж ви хоча б трохи знайомі з програмуванням, можна використати скрипт, який видаляє все, крім друкованих символів. Такий скрипт легко попросити в того ж ChatGPT, а рішення для рідкісніших випадків — наприклад коли потрібно прибрати лише частину недрукованих знаків — можна пошукати на Stack Overflow. Щоправда, для звичайного очищення тексту це вже майже як стріляти з гармати по горобцях.

Відповіді на популярні запитання

  • Які символи можуть видати текст, написаний ІІ?

    Найчастіше увагу привертають невидимі Unicode-символи: нерозривні пробіли, вузькі нерозривні пробіли, незвичайні апострофи та екрановані знаки на кшталт $ або ~. У звичайному редакторі вони можуть не кидатися в очі, але при перевірці стають помітними.

  • Чому в текстах ChatGPT з'являються непечатні символи?

    Зазвичай це пов’язано не з умисною маркуванням тексту, а з особливостями генерації, форматування та екранування символів. Деякі знаки мають спеціальне значення в мовах розмітки або програмування, тому система може додавати перед ними зворотний слеш.

  • Чи можна за такими символами точно визначити, що текст написав ІІ?

    Ні, на 100% покладатися на цей знак не можна. Невидимі символи можуть з’явитися й з інших причин: через копіювання тексту, роботу редактора, сайту або автоматичну обробку. Але якщо таких знаків багато і вони стоять у дивних місцях, це привід перевірити текст уважніше.

  • Як перевірити текст на приховані Unicode-символи?

    Простіше всього вставити текст в онлайн-інструмент для перегляду символів, наприклад SoSci Survey, або відкрити його в редакторі коду на кшталт VS Code або Sublime Text. Такі редактори допомагають побачити частину непечатних знаків, які не відображаються в звичайному текстовому полі.

  • Як прибрати непечатні символи з тексту?

    Якщо символів мало, їх можна видалити вручну або замінити через пошук. Для великих текстів зручніше вставити матеріал у Google Docs, потім скопіювати його назад через вставку без форматування або використовувати пошук і заміну в редакторі.

  • Чому зворотний слеш перед символами на кшталт $ і ~ вважається підозрілішим?

    Звичайна людина при написанні тексту майже ніколи не ставить зворотний слеш перед такими символами. А от для машинної обробки це звичний спосіб показати, що знак потрібно вивести як звичайний символ, а не виконувати як частину команди або розмітки.

  • Чи потрібно переписувати текст вручну, щоб прибрати сліди ІІ?

    Ні, в цьому зазвичай немає сенсу. Досить перевірити текст спеціальним інструментом, очистити форматування, прибрати зайві символи і перечитати матеріал очима. У більшості випадків цього достатньо, щоб текст виглядав акуратно і природно.

admin logo
Всім привіт! У цьому блозі ми викладаємо корисну інформацію на тему Як виявити приховані символи в тексті ChatGPT та швидко їх видалити. Якщо у вас є питання чи ідеї, які ми не розкрили у нашій статті – пишіть про це у коментарях.
Оцініть автора
( 1 Оцінка, середнє 5 з 5 )
Трихомонада: методи діагностики, коли потрібно здати аналізЯк мотивувати себе на зміни, якщо вас затягнуло в «день сурка»
Нові пости
Популярні статті