У цій статті ми хочемо поділитися з вами досвідом, який нещодавно отримали. Йтиметься про новий спосіб «обману» професійними копірайтерами своїх замовників.
Відомі способи неякісної унікалізації
Більшість методів обману копірайтерами вже давно відомі, як і способи їх виявлення. Найпоширеніші прийоми неякісної унікалізації текстів для просування сайтів:
➤ заміна слів синонімами за допомогою синонімайзерів;
➤ підміна кириличних літер латинськими (наприклад, А, В, С, Е, Н, К, М, О, Р, Т, Х; а, с, е, о, р, х, у);
➤ автоматичні переклади текстів з однієї мови на іншу.
Такі маніпуляції легко виявити, якщо уважно прочитати текст і перевірити його на унікальність за допомогою сервісів, таких як Candy-Content, PlagiarismDetector та інших.
Новий спосіб обману
Нещодавно ми зіткнулися з більш складним і цікавим способом обману, про який майже не згадується в мережі. Текст виглядав добре написаним і цікавим, а перевірка показувала 100% унікальність. Проте нас насторожило, що Microsoft Word підкреслював усі слова як помилкові. При копіюванні фрази з тексту у Google плагіат не виявлявся, але результати пошуку повертали або безглузді фрази, або повідомлення «Нічого не знайдено».
Приклад:
Після введення частини тексту вручну в Google ми знайшли джерела, де текст повністю дублював замовлений. Стало зрозуміло, що унікальність була створена штучно, але механізм залишається загадкою.
Розслідування: як це працює?
Спочатку ми припустили, що використано звичайну підміну кириличних букв на схожі латинські (A, B, C, E, H, K, M, O, P, T, X; а, c, e, o, p, x, y). Проте перевірка тексту в Notepad++ з використанням регулярних виразів, які охоплюють лише латинські символи, нічого не виявила.
Заглибившись, ми звернули увагу на URL пошукового запиту в Google. У ньому був присутній символ %E2%80%AD, який не відображався у текстових редакторах. Цей символ у кодуванні UTF-8 (U+202D) відповідає за перевизначення напрямку тексту — з «праворуч-наліво» на «ліворуч-направо» (Left-to-Right Override). В URL він представлений як %E2%80%AD, де % передує кожному байту символу. Після декодування тексту цей символ залишається невидимим, але впливає на сприйняття тексту пошуковими системами.
Цікавий факт: метод розподілення напрямку тексту може використовуватись для поширення шкідливих програм електронною поштою, що робить його потенційно небезпечним.
Однак проблема полягала не лише у символі %E2%80%AD. Навіть після його видалення з адресного рядка Google ми все одно отримували некоректні результати пошуку. Подальший аналіз показав, що російську букву «о» в тексті було замінено на грецьку «ο» (Unicode U+03BF), які візуально не відрізняються.
Механізм обману
Після ретельного аналізу ми дійшли висновку, що копірайтер використовував скрипт або програму, яка дозволяє швидко створювати «унікальні» тексти у великих обсягах. Алгоритм роботи програми:
➤ Через кожні 1–4 символи в текст вставляється невидимий символ %E2%80%AD. Приклад: «Манометри» перетворюється на «М%E2%80%ADано%E2%80%ADметр%E2%80%АДи».
➤ Усі кириличні літери «о» замінюються на грецькі «ο».
➤ Текст декодується за допомогою функцій, таких як URLDecode (PHP) або decodeURI (JavaScript), або їх аналогів.
➤ У результаті виходить текст, який виглядає як «Манοметри», але має 100% унікальність за даними сервісів перевірки, таких як Candy-Content.

Чому ми впевнені, що це скрипт?
Один копірайтер за 5 робочих днів написав 800 тисяч символів тексту із заявленою 100% унікальністю. Такий обсяг вручну створити практично неможливо.
Як захиститися?
Щоб не стати жертвою подібного обману, рекомендуємо:
➤ Перевіряти текст у кількох сервісах унікальності — Candy-Content, PlagiarismDetector.
➤ Аналізувати текст у Notepad++ за допомогою регулярних виразів для пошуку некириличних символів.
➤ Вводити фрази вручну в Google, якщо копіювання тексту не дає результатів.
➤ Звертати увагу на поведінку редакторів, таких як Word, де підкреслення слів може сигналізувати про проблему.
Для захисту від обману важливо використовувати різні інструменти перевірки тексту та уважно аналізувати його структуру й джерела.
Висновок
Недобросовісні копірайтери використовують складні методи, щоб створити видимість унікального контенту. Скрипти дозволяють їм швидко генерувати великі обсяги тексту, які проходять перевірки на унікальність, але насправді є плагіатом. Будьте уважні й обережні під час замовлення текстів для просування сайтів!
Усім успіхів у створенні якісного контенту!