UWAGA na spamowy ruch z odesłań w Google Analytics #PimpMyAnalytics
U wielu klientów coraz częściej (przynajmniej w Q3 i Q4 2014) spotykam się z rosnącą ilością wejść z odesłań, które generują bardzo dużą ilość ruchu, a słabe zaangażowanie na stronie. O konwersji nie wspominając.
Źródła odesłań, które są ostatnio w trendzie rosnącym (analityczna hossa), dające śmieciowy ruch to z pewnością:
darodar.com
econom.co
iloveitaly.com
7makemoneyonline.com
saveyoutubevideo.com
cclicking.com
buttons-for-website.com
tasteidea.com
kambasoft.com
Sprawdź czy któraś z powyższych stron nie spowodowała sesji w Twoim Google Analytics.
Jak się pozbyć śmieciowego ruchu z odesłań w Google Analytics?
Tworzymy filtr wykluczający odesłanie z konkretnej domeny według poniższego wzorca:
Filtr Niestandardowy
Warunek = Wyklucz
Pole filtru = Odesłanie
Wzorzec filtru = .\.darodar\.com
Powyższy filtr wykluczy wszystko z adresów, które będą kończyć się na darodar.com. Filtr będzie wykluczał wszystkie subdomeny w domenie głównej zawierającej darodar.com.
Tworząc filtr pamiętaj o dodaniu go najpierw na Widoku testowym oraz o tym, że kolejność stosowanych przez Ciebie filtrów ma znaczenie!
Z praktycznego punktu widzenia poza Google Analytics (np. unikanie obciążeń serwera – by nie dać zarobić za dużo w zenbox.pl ;)) warto dodatkowo wykluczyć ruch z odesłań z poziomu samego serwera wpisem do .htaccess:
RewriteEngine on
RewriteCond %{HTTP_REFERER} darodar\.com [OR,NC]
RewriteCond %{HTTP_REFERER} saveyoutubevideo\.com
RewriteRule . – [F]
W celu blokowania kolejnych hostów wystarczy dodać linijkę:
RewriteCond %{HTTP_REFERER} przyklad\.pl [OR,NC]
zastępując przyklad\.pl nazwą kolejnego hosta zaraz po wierszu RewriteEngine on
Najchętniej bym spamowe referrale zabił odbijając piłeczkę (oko za oko):
if ($http_referer ~*_ (saveyoutubevideo\.com) ) {
rewrite ^.*$ __http://saveyoutubevideo.com?utm_source=google&utm_medium=organic&utm_term=stop+spamming+us___ permanent;
}
BONUS na początek A.D. 2015
Zalecam przegląd kont Google Analytics pod kątem zachowań użytkowników z różnych miast (np. Palo Alto) lub sesji pochodzących od dziwnych (z punktu widzenia nazewnictwa) ISP.
Nie każdy spamowy ruch, który ma wykluczać Google Analytics opcją Wykluczenie wszystkich działań znanych robotów będzie przez GA wyłapywany.
Szukając robotów zwróć uwagę na wzorzec wejść, który wygląda mniej więcej tak, że każda sesja to nowy użytkownik, który ma 100% współczynnik odrzuceń, a co za tym idzie widzi 1 stronę/sesje i ma 00:00:00 czas na stronie. W moim uznaniu jest to tzw. spamowy traffic. Oczywiście nie mówię w tym przypadku o próbce sesji n=1 😉
Unikaj GIGO, czyli Garbage In Garbage Out
Pamiętaj, że im bardziej zadbasz o swoje dane w Google Analytics tym lepsze jakościowo wnioski będziesz wyciągać. Przeglądaj swoje konto porządnie – przynajmniej raz na kwartał, dbając o jak najwyższą jakość rejestrowanych przez GA danych.
Hint: nie każda strona, którą znajdziesz w raporcie odesłań to zwykła strona odsyłająca. Znajdują się tam również nie rozpoznawane standardowo przez Google inne wyszukiwarki organiczne. Możesz to łatwo zmienić.
Współczynnik konwersji
W hardcore’owych sytuacjach obniżając liczbę spamowych wejść (bo defacto je wykluczysz) wzrośnie Tobie współczynnik konwersji. Mniejsza liczba sesji przy tym samym wolumenie transakcji lub realizacji celów podniesie Twój CR 😉
Zapisz się do newslettera wypełniając pola poniżej. Będziesz na bieżąco ze wszystkimi wydarzeniami związanymi z Silesia SEM i informacjami o marketingu internetowym w sieci. Nie spamujemy.
Zostanie wysłany do Ciebie e-mail potwierdzający: przeczytaj zawarte w nim instrukcje, aby potwierdzić subskrypcję.
Maciej Lewiński
Ostatnie wpisy Maciej Lewiński (zobacz wszystkie)
- 7 grzechów głównych popełnianych przy wdrożeniach Google Tag Managera #PimpMyAnalytics - 14 sierpnia 2015
- Jak zniszczyć instalację Google Analytics? #PimpMyAnalytics - 7 sierpnia 2015
- Spamowy ruch z odesłań w Google Analytics #PimpMyAnalytics - 23 stycznia 2015
Maciej,
a znasz wzór na wykluczenie tego hurtowo?
Testowałem (tak i podobnie): [medispainstitute|hostingbot|bycontext|darodar|econom|iloveitaly|blackhatworth|7makemoneyonline|saveyoutubevideo|cclicking|buttons\-for\-website|tasteidea|kambasoft]\.[com|co|com.au]
ale chyba coś źle wpisywałem bo albo nie wykluczało ruchu albo wykluczyło…cały z wszystkich źródeł.
U mnie na 2 witrynach mam odesłania z darodar.com – równo po 26 wejść i na razie stoi, a na trzeciej z buttons-for-website.com oraz kambasoft.com – po kilka wejść i co jakiś czas rośnie.
Również w swoim GA odnalazłem wejścia z darodar.com, hostowanego w rosji. Poszukałem trochę informacji na ten temat: http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/
Blokada w htacess podobno nic nie da, gdyż tak naprawdę nikt nas nie odwiedza (porównałem z logami serwera). To są jakieś alpejskie kombinacje z analitycsem.
Radzę sprawdzić pozostały ruch, być może wygląda to tak samo.
Na ile wynika z tego linka:
http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/
Problem nie dotyczy zenbox.pl bo jest to referer spam na google analytics. W rzeczywistości nikt nie wchodzi na stronę więc nasze statystyki tego nie zliczą.
Problem ze #SPAM’em w refererrach jest złożony. Obecnie wykryłem około 55 stron odsyłających spamowy ruch do Google Analytics. Opisany przeze mnie problem pod koniec 2014 roku na G+ to wierzchołek góry lodowej jak się okazuje. Istnieją różne rodzaje spamu 🙁
Póki co lakonicznie (jak znajde czas to napiszę pełen wpis na blogu lub zrobię prezentacje na ten temat):
0. Mimo wszystko filtrujcie ruch ze spamerskich referrali
1. Prawidłowo skonfigurujcie GA (m.in. ustawienia widoku i wykluczanie znanych robotów)
2. W .htaccess blokujcie spamowe odesłania
3. W .htaccess blokujcie IP spam botów
4. W .htaccess blokujcie zakres IP spam botów (np. wykorzystując CIDR)
5. W .htaccess blokujcie user agentów używanych przez spam boty
6. Monitorujcie logi serwera (minimum 2x w miesiącu)
7. Ustawcie w GA alerty niestandardowe informujące o nagłych wzrostach ruchu
8. Zainwestujcie w testy penetracyjne
@Macieju
skoro już odkryliśmy, że spam jest kierowany na GA z pominięciem serwera (losowanie user id z GA) to po co mamy robić cokolwiek na serwerze, nie mówiąc już o pentestach ? Raczej Google powinno się tym zająć bo problem dotyczy ich statystyk. My możemy tylko to filtrować.
Chyba, że mówisz coś co rzeczywiście przechodzi przez serwer. W internecie można dostrzec, że problem jest masowy i dotyczy GA (jeżeli mówimy o tym spamie, który potrafi wpłynąć na nasze statystyki GA z pominięciem naszego serwera)
@Lukas sluszne spostrzezenie, ale kazdy medal ma dwie strony.
GA jest usluga, ktora trzeba skonfigurowac pod siebie (np. cele, widoki danych itp.). BTW nie wszystkie odeslania to odeslania, bo w raportach odeslan mozna znalezc czesc ruchu z wyszukiwarek, ktorych GA nie rozpoznaje. Google wszystkiego za nas nie zrobi.
Co do pracy Google nad rozwiazaniem problemu, to juz jest otwarty projekt ktorego cele zajecie sie zjawiskiem spam referrali. Jednym z pomyslow jest dodanie do raportu z odeslan flagowania zrodla ruchu jako SPAM. Idea zaczerpnieta z Gmaila 😉
Musimy poczekac na ruch ze strony G, bo problem spamu w GA z czasem staje sie coraz bardziej uciazliwy. W grudniu 2014 lista referrali wynosila okolo 20 ston, a na dzien dzisiejszy mam juz ich przeszlo 75.
Przydał by się jakiś hurtowy wpis do GA i .htaccess
U mnie teraz .htaccess w katalogu domains wygląda tak:
RewriteEngine on
RewriteCond %{HTTP_REFERER} darodar\.com [OR,NC]
RewriteCond %{HTTP_REFERER} buttons-for-website\.com [OR,NC]
RewriteCond %{HTTP_REFERER} best-seo-offer\.com [OR,NC]
RewriteCond %{HTTP_REFERER} simple-share-buttons\.com [OR,NC]
RewriteCond %{HTTP_REFERER} buttons-for-your-website\.com [OR,NC]
RewriteCond %{HTTP_REFERER} free-share-buttons\.com [OR,NC]
RewriteCond %{HTTP_REFERER} guardlink\.org [OR,NC]
RewriteCond %{HTTP_REFERER} Get-Free-Traffic-Now\.com [OR,NC]
RewriteCond %{HTTP_REFERER} buy-cheap-online\.info [OR,NC]
RewriteCond %{HTTP_REFERER} free-social-buttons\.com [OR,NC]
RewriteRule . – [F]
Wiecie może, czy G już zajęło się problemem? Na moim koncie pojawiły się wejścia z:
site4.free-share-buttons
free-share-buttons
best-seo-offer
http://www.event-tracking
buttons-for-your-website
free-social-buttons
site3.free-share-buttons
http://www.Get-Free-Traffic-Now
Jaki ktoś ma interes w wysyłaniu tego badziewia?
Ustawiłem wszystko w .htaccess jednak admin linuxpl.com twierdzi, żre to nie zadziała 😉
Dołączam moje dziwne domeny:
floating-share-buttons.com
site1.floating-share-buttons.com
http://www.event-tracking.com
Co to może oznaczać?
mam tą domenę event-tracking.com i robiąc wykluczenie ..event-tracking.com za nic nie chce się dodać do filtrów
A czy idzie w ogóle wykluczyć ten spamowy ruch na naszą stronę czy to nie możliwe jest. Jeśli tak to jak ?