Scritto da
Martedì, 09 Dicembre 2014

Referrer spam, se lo conosci ti dico come evitarlo!

La rete è piena di trappole, alcune praticamente innocue, altre sicuramente meno. Chi ha un sito web e lo gestisce con una certa attenzione avrà sicuramente avuto occasione di imbattersi, consultando le statistiche analitiche (io personalmente consiglio l'ormai famosissimo Google Analytics) relative alle visite, in alcuni dati contrastanti, ovvero quelli relativi alla percentuale di rimbalzo dei visitatori, ovvero il tempo che impiega un utente approdato sul nostro sito web a consultare i contenuti prima di "uscire" dal sito. 

Le visite che devono insospettirci sono quelle che hanno come frequenza di rimbalzo un valore del 100%, un rapporto di pagine/sessione di 1,00 e una durata di sessione media di 00:00:00. È strano in quanto un utente umano, per quanto può aver sbagliato a cliccare sul vostro sito oppure scoprisse che l'argomento non gli interessa impiega sempre un determinato periodo di tempo a compiere una azione, anche se nell'ordine di secondi. Un BOT invece no. Ecco, quelle sono visite referrer spam!

Che cos'è il referrer spam e come funziona? 

Una tattica comune in rete che i webmaster maligni (i famigerati black seo) usano è quello di cercare e pubblicizzare il loro sito impegnandosi con il referrer spam. Ciò significa che creeranno un web crawler automatico molto simile a Google Googlebot, poi inviano questo crawler a visitare centinaia di milioni di siti web e fingendo di essere un normale browser web. La stringa user-agent (che identifica l'utente, il sistema e il computer che usa) che il crawler invia sia Chrome o Internet Explorer o un altro browser web simula una ricerca umana. Ma la differenza fondamentale è che si invia una stringa referrer falsa per qualsiasi sito web che visita, ciò significa che fa apparire su qualsiasi sito web che visita che è arrivato da un sito web, mentre in realtà non è così. 

A noi interessa che tutte queste manovre, senza scendere ulteriormente nel dettaglio, falsano i risultato delle statistiche legate ai nostri siti web, possono aumentare i costi di campagne PPC e Display e possono pubblicare URL maligni nei file di log e nei database. 

Come evitare il problema alla radice? Usiamo il file .htaccess!

Dopo esserci assicurati che una serie di visitatori del nostro sito sia, effettivamente, originato da referrer spam, possiamo bloccare l'accesso al nostro sito tramite il file .htaccess

Scaricate il file .htaccess sul vostro computer, rinominatelo htaccess.txt per aprirlo con il blocco note. Prima di ogni altro contenuto digitate il seguente codice:  

RewriteEngine On<
RewriteCond %{HTTP_REFERER} ^http://.*nomesitoweb\.estensione [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*nomesitoweb\.estensione [NC]
RewriteRule (.*) – [R=301,L]

Ho inserito due regole, ma voi potreste aver bisogno solo di una, e quindi il codice sarebbe:   

RewriteEngine On 
RewriteCond %{HTTP_REFERER} ^http://.*nomesitoweb\.estensione [NC] RewriteRule (.*) – [R=301,L]

Ovviamente nel "nomesitoweb" dovete inserire il nome del dominio e al posto di "estensione" dovete inserire l'estensione, come, ad esempio, .it .com .org, che ha il sito.

Se hai un sito Joomla devi scrivere tutto sotto RewriteEngine On senza ricopiare di nuovo la suddetta stringa.

Dopo aver effettuato le modifiche (fai un backup del file .htaccess, MI RACCOMANDO) copia il file htaccess.txt nella directory principale del tuo sito web e rinominalo di nuovo in .htaccess ed il gioco è fatto. Prima di escludere dei domini fai una ricerca internet per verificare di avere davvero a che fare con siti di spam, per una sicurezza in più puoi utilizzare il Google Safebrowsing, sostituendo la stringa mysite.com con l'URL della pagina o del sito da controllare.

Letto 4919 volte
Vota questo articolo
(1 )

Forse ti possono interessare anche questi articoli:

Lascia un commento

Assicurati di inserire (*) le informazioni necessarie ove indicato.
Codice HTML non è permesso.

3 commenti

  • Link al commento Stampa Online Martedì, 03 Novembre 2015 17:27 inviato da Stampa Online

    Articolo molto interessante. Sicuramente da approfondire maggiormente.

    Rapporto
  • Link al commento http://healthraport.it Mercoledì, 05 Agosto 2015 17:48 inviato da http://healthraport.it

    Non c'è niente come centrare specificamente il punto.
    L'hai fatto, e so quello che dico, perché da
    un po 'sono alla ricerca di queste cose in rete

    Rapporto
  • Link al commento Giorgio B. Martedì, 09 Dicembre 2014 17:30 inviato da Giorgio B.

    Ecco, in effetti anche il mio sito riscontra questa problematica della frequenza di rimbalzo del 100%, molto spesso.
    Ad ogni modo provo questa tua dritta.

    Rapporto