Реферальний спам: що це таке і як з ним боротися?

Реферальний спам: що це таке і як з ним боротися?

Глобальна проблема в SEO — наявність реферального спаму, який негативно впливає на показники трафіку. У нашій сьогоднішній статті ми розглянемо більш детально, як його виявити і позбутися.

Що ж таке реферальний спам?

Реферальний спам — це негативний трафік, який передають спам-боти під прикриттям різних доменів та IP-адрес. За наявності рефспаму сайт отримує накручений трафік від спам-ботів, що може призвести до санкцій пошукових систем за поведінковими факторами (показник відмов або тривалість сеансів).

Спам-боти часто шукають слабо захищені сайти та піддають їх атакам. Якщо ваш сайт розміщений на дешевому хостингу або створений на незахищеній легкій CMS-системі, ймовірність того, що спам-боти звернуть увагу на ваш ресурс, дуже висока.

Як виявити наявність реферального спаму?

➤ Увійдіть у Google Analytics сайту, який перевіряє на реферальний спам.

➤ Перейдіть у «Джерела трафіку» → «Весь трафік» → «Реферали».

Фото 1 - Реферальний спам: що це таке і як з ним боротися?

➤ Відсортуйте звіт у порядку спадання за показниками відмов.

Фото 2 - Реферальний спам: що це таке і як з ним боротися?

Зверніть увагу на рефералів із показником відмов 100% та тривалістю сеансу 0. Це 100% реферальний спам.

Методи боротьби з реферальним спамом

1. Блокування реферала, який використовує спам-бот

Для цього необхідно внести наступні директиви у файл .htaccess, що знаходиться в корені сайту.

Приклад:

RewriteEngine On  Options +FollowSymlinks RewriteCond %{HTTP_REFERER} ^https?://([^.]+\.)*site\.com\ [NC,OR] RewriteRule .* – [F]

Цей код заблокує всі http та https реферали з сайту site.com та з усіх його піддоменів.

2. Блокування IP-адреси, яка використовує спам-бот

Для цього необхідно внести наступні директиви у файл .htaccess, що знаходиться в корені сайту.

Приклад:

RewriteEngine On  Options +FollowSymlinks Order Deny,Allow Deny from 123.45.67.89

Важливо! Це лише приклад, у такому вигляді він не спрацює — вам потрібно підставити власні значення IP-адрес.

3. Виключення реферального трафіку

Щоб реферальний трафік не сумувався з загальним трафіком, необхідно створити та налаштувати фільтри трафіку в Google Analytics, які надалі не будуть враховувати джерела реферальних атак.
Перейдіть у «Джерела трафіку» → «Весь трафік» → «Джерело/Канал».

Фото 3 - Реферальний спам: що це таке і як з ним боротися?

Ми бачимо джерела трафіку різного типу. Нас цікавить реферальний. Спам-боти можуть змінювати джерела та робити їх схожими між собою за назвою.

Приклад №1: Виключаємо реферальних спамерів, які містять повторюване слово всередині своєї назви.

Фото 4 - Реферальний спам: що це таке і як з ним боротися?

Виходячи з трафіку за останні 6 місяців, виділимо лише ті джерела, які містять у собі слово «buttons».
Для цього через пошук по трафіку відсортуємо джерела, що містять «buttons».

Фото 5 - Реферальний спам: що це таке і як з ним боротися?

У результаті ми отримаємо список усіх доменів із вмістом у назві «buttons», які використовували спам-боти для реферала.

Фото 6 - Реферальний спам: що це таке і як з ним боротися?

21 джерело реферального спаму з вмістом у назві «buttons»

Щоб виключити ці спам-джерела трафіку, необхідно перейти в пункт верхнього меню «Адміністратор». Далі, у колонці «Представлення» обрати пункт «Фільтри».

Фото 7 - Реферальний спам: що це таке і як з ним боротися?

Для створення нового фільтра натисніть кнопку «Додати фільтр».

Фото 8 - Реферальний спам: що це таке і як з ним боротися?

Далі необхідно створити шаблон фільтра, який буде виключати трафік від усіх спам-джерел, що містять «buttons».

Фото 9 - Реферальний спам: що це таке і як з ним боротися?

У шаблоні фільтра використовувалося регулярне вираження .*buttons, яке враховує всі символи, включно з їх повторенням до слова «buttons». З моменту збереження весь наступний трафік, що надходитиме від реферальних спамерів із «buttons», не буде враховуватися у подальшій статистиці трафіку.

Фото 10 - Реферальний спам: що це таке і як з ним боротися?

Приклад №2: Виключаємо трафік хостів з однаковим початком назви. На даний момент виявлено 26 хостів, які починаються зі слова «site».

Фото 11 - Реферальний спам: що це таке і як з ним боротися?

Щоб виключити ці спам-джерела трафіку, необхідно перейти в пункт верхнього меню «Адміністратор», далі у колонці «Представлення» обрати пункт «Фільтри».

Фото 12 - Реферальний спам: що це таке і як з ним боротися?

Для створення нового фільтра натисніть кнопку «Додати фільтр».

Фото 13 - Реферальний спам: що це таке і як з ним боротися?

Далі необхідно за допомогою регулярного вираження задати умову виключення всіх джерел, які починаються зі слова «site».

Фото 14 - Реферальний спам: що це таке і як з ним боротися?

Регулярне вираження ^site вказує, що всі спам-хости, які починаються на site, будуть виключені з загального трафіку з моменту збереження фільтра. Зберігаємо і отримуємо таку картину:

Фото 15 - Реферальний спам: що це таке і як з ним боротися?

Приклад №3: точкове виключення
Припустимо, у нас є спам-хост, виключити його за допомогою регулярного вираження ми не зможемо, оскільки він один.

Фото 16 - Реферальний спам: що це таке і як з ним боротися?

Щоб точково заблокувати подібні хости, необхідно створити фільтр для кожного окремого спам-реферала.

Фото 17 - Реферальний спам: що це таке і як з ним боротися?

Зберігаємо і отримуємо наступне:

Фото 18 - Реферальний спам: що це таке і як з ним боротися?

Важливо! При видаленні цих фільтрів спам-трафік знову почне надходити до статистики загального трафіку. Мінус цього рішення в тому, що список таких рефералів постійно поповнюється, і необхідно періодично моніторити звіти трафіку на предмет появи нових рефералів, щоб уникнути спотворення статистики.

Наскільки корисним був цей пост?

Натисніть на зірочку, щоб оцінити!

Підрахунок голосів: 5 / 5. Підрахунок голосів: 2

Голосів поки немає! Будьте першим, хто оцінить цю публікацію.

SEO продвижение