Colmare le Discrepanze tra Search Console e Google Analytics

//Colmare le Discrepanze tra Search Console e Google Analytics

Colmare le Discrepanze tra Search Console e Google Analytics

tratto da alcuni spunti dei miei colleghi/amici Matteo e Simone

Da bravo nerd con tendenze alla OCD ho sempre trovato molto interessante l’idea di far tornare tutti i conti possibili nella maniera più precisa possibile.

Per questo cercare di allineare i risultati di Google Search Console (i clic) e di Google Analytics (le sessioni) mi è sempre sembrato un traguardo interessante.

Perchè voglio incrociare questi dati

Dall’avvento del Not Provided nel 2013, tutti i web analyst si sono rivolti al webmaster tool, diventato poi search console, che dopo qualche anno ha potenziato la reportistica offerta, fornendo i dati che vediamo ancora oggi.

Su questo blog ho parlato diverse volte dell’utilità di allineare i dati di analytics e search console:

ecco quindi che avere clic e sessioni, non dico proprio uguali, ma non troppo discordanti diventa molto importante.

Metriche differenti

ovviamente dobbiamo fare questa premessa: il primo strumento misura (o come vedremo cerca di misurare) il numero di clic sugli snippet di ricerca del nostro sito su Google, mentre il secondo ci dice quante sessioni si sono attivate sul sito, provenienti dal motore di ricerca di Big G.

Sono due cose molto simili quindi, ma non la stessa cosa.

Per i motivi che vedremo di seguito i due numeri differiscono su vari aspetti.

Altre premesse

Se vogliamo sperare di avere un confronto credibile dobbiamo ovviamente accertarci di alcune cose piuttosto ovvie:

  • Google Analytics deve riferirsi al solo dominio interessato da search console; se sta tracciando più di un dominio filtriamo via gli altri con un segmento
  • Tutte le pagine del sito (o almeno quelle raggiungibili da Google) devono contenere la pageview di analytics
  • Se il sito ha cambiato di recente protocollo da Http ad Https, o semplicemente ha pagine sicure e altre no ricordiamoci che search console li tratta come due siti separati, e le statistiche andranno sommate (stesso dicasi per www e non).
  • i pdf indicizzati non hanno la pageview analytics, quindi eslcudiamoli dai dati di Search Console
  • se in Google analytics avete attivati filtri, o altre impostazioni avanzate (come l’esclusione dei termini di ricerca) che possono modificare il traffico organico tenetelo in considerazione

Clic in eccesso

partiamo dal caso più semplice, cioè quando le sessioni in analytics sono di meno.

Se si tratta di una percentuale bassa, diciamo tra la 0% e il 30% allora siamo a posto così.

Vi basti considerare due casi

Doppio clic, una sessione

ovvero lo stesso utente clicca una volta su un vostro risultato e visita il sito, torna indietro, riclicca poco dopo sullo stesso o su un altro risultato, rivisitando il sito.

Ovviamente può succedere anche più di due volte, facendo aumentare i clic ma non le sessioni, basta che l’utente torni sul sito, da organico, usando lo stesso browser ed entro mezz’ora tra una visita e l’altra (mezz’ora è la durata del cookie di sessione analytics, che volendo potete modificare nelle impostazioni di analytics stesso).

Codice Analytics non caricato

Se un utente clicca ma non aspetta il caricamento della pagina e torna indietro ecco che abbiamo 1 clic e 0 sessioni.

Può succedere per via di un clic errato, oppure per una connessione lenta che fa attendere troppo per caricare la pagina, ma sta di fatto che in una certa percentuale succede e non è trascurabile.

Sessioni in eccesso

veniamo al caso meno frequente, dove le sessioni analytics provenienti da organico sono inspiegabilmente maggiori dei clic.

Visite da Google My Business

il 70% delle volte questo risolve il dilemma.

Il traffico che arriva dal bottone “Sito Web” dello snippet di My Business non viene conteggiato come clic in Search Console, ed è nativamente indistinguibile da una sessione organica proveniente da un normale risultato su Google.

Ho già scritto in questo articolo di come misurare il traffico di Google My Business per avere così i due dati separati.

Come vedete può essere una percentuale davvero enorme del traffico organico.

Per ora vi basterà accedere ai report dello strumento per sottrarre i clic della mappa alle sessioni di Analytics

Web, immagini, video

Non dimenticate nel conteggio del clic di aggiungere anche quelli proveniente dalle ricerche immagini e video.

anzi sarà sicuramente interessante andare a vedere a che pagine portano e con quali query i vostri media compaiono nei motori immagini e video di Google.

Last Session non Direct

altra spiegazione, meno incisiva a livello di volumi e il metodo di attribuzione della sorgente di Analytics, che può in alcuni casi fa risultare due sessioni ma un solo clic.

in questa immagine lo stesso utente ha effettuato due sessioni, la prima da Google, alle 11:49, generando 1 clic ed una sessione.

Dopo pranzo è tornato ed ha aggiornato la pagina: la sessione analytics (quella che dura di default 30 minuti) è ora scaduta e quindi la nuova sessione sarebbe direct.

Tuttavia il cookie utente non è affatto scaduto (di default dura 6 mesi), quindi google lo riconosce e assegna anche la seconda sessione al traffico organico, per evitare di aggiungere una sessione direct.

Questo è il metodo di attribuzione di analytics, che assegna alla sessione la sorgente dell’ultima sessione non diretta dell’utente che l’ha generata.

Ecco dunque 1 clic e 2 (o anche più) sessioni.

Quanto spesso capita? Molto poco, quindi no, non può spiegare enormi differenze di dati.

Dati stimati e aggregati

i dati analytics non sono strettamente esatti, innanzitutto per via del sistema fatto di cookie e javascript che è per sua natura impreciso, specialmente da qualche anno in seguito ai vari provvedimenti di privacy e di blocco dei cookie.

Search console non è da meno.

andando ad analizzare i brevetti di Google scopriamo infatti che i dati di clic non sono l’esatta analisi del log degli utenti, ma solo una stima di essi:

To get reliable statistical information from the query log 108, it is not always necessary to survey all the query records (also herein called log records or transaction records) in the query log. As long as the statistical information is derived from a sufficient number of samples in the query log, the information is as reliable as information derived from all the log records.

fonte – Google patents

inoltre udite, udite, due ricerche consecutive, ai nostri occhi completamente diverse, possono contare come un unica ricerca alla quale vengono attribuiti i clic in Search Console

In some embodiments, these related queries are grouped together into a query session to characterize a user’s search activities more accurately.

[…] For example, the user may first submit a query “French restaurant, Palo Alto, Calif.”, looking for information about French restaurants in Palo Alto, Calif. Subsequently, the same user may submit a new query “Italian restaurant, Palo Alto, Calif.”, looking for information about Italian restaurants in Palo Alto, Calif. These two queries are logically related since they both concern a search for restaurants in Palo Alto, Calif.

fonte – Google patents

a questo punto analizzando una pagina di destinazione potremmo trovare 50 sessioni e solo 25 clic, perchè gli altri 25 sono incorporati in un altra query che punta ad un altra pagina.

Dati più precisi

Ora abbiamo alcuni strumenti per cercare di allineare i due dati e procedere con le nostre analisi, senza la pretesa di vederli combaciare, ma con la possibilità di capire quanto e come differiscono per poterli utilizzare.

Buone analisi a tutti

By |2020-04-23T12:02:52+02:00Aprile 14th, 2020|2 Comments

About the Author:

Dal 2008 mi occupo di comunicazione e pubblicità digitale, specializzandomi in Sem/Seo e Web Analytics. Ho pensato che era ora di aprire un blog dove esporre nella maniera più chiara possibile i miei voli pindarici sull'analisi dati web. Buona fortuna allora!

2 Comments

  1. Daniel Novembre 16, 2020 at 1:29 am - Reply

    Ciao,
    una domanda: dici che se siamo dallo 0% al 30% di sessioni in meno rispetto ai click è normale.
    Da cosa può dipendere essere sopra il 30%?

    • Mattia Follari Novembre 16, 2020 at 1:49 pm - Reply

      Ciao Daniel, hai già escluso tutti i fattori che elenco nell’articolo?

Leave A Comment