Come funziona Google.it, tutta la verità

by francesco 18.9K views6

Quest’articolo prova a fare due cose, posizionarsi per la chiave nel titolo e offrire uno spunto per cogliere un aspetto importante del funzionamento di Google.

Come funziona Google.it
Come funziona Google.it

Google.it offre visibilità gratuita e traffico alle fonti di contenuti che aggiungono valore alla vita delle persone. È un motore di ricerca che classifica e filtra le informazioni da mostrare nelle sue pagine come risposte alle interrogazioni degli utenti o “query”.

Una query è qualunque cosa un utente decida di scrivere nella barra di ricerca, anche una sola lettera, anche una parola chiave dal volume di ricerca altissimo, anche la domanda “qual è la verità sugli alieni?”.

Rilevanza e posizionamento

Conosco tre modi per rendere un contenuto rilevante, quindi meritevole di un buon posizionamento su Google.it. Il primo è fornire in assoluto la risorsa più completa. Guarda ad esempio che bel lavoro ha fatto Nozzespeciali.it per guadagnare un buon posizionamento sulla chiave “come organizzare un matrimonio”. Osserva come è organizzata la homepage e quanto risponde a tutte le possibili domande creando un elenco di link interni verso le pagine di approfondimento tematiche. La stessa cosa vale per StudioSamo.it che si è posizionato in prima pagina per la chiave secca “SEO” fornendo una guida similmente architettata. Jacopo li chiama “spiegoni”. 🙂

Il secondo modo che conosco è costruire un contenuto pur esteso e circostanziato, tuttavia non genericamente orientato a mostrare come si fa una cosa, ma declinato intorno ad un evento importante che si è tenuto sull’argomento. Mi viene in mente la mega risorsa del Vaccari, il cui titolo è proprio Come funziona Google, in cui Emanuele ha tradotto l’intervento di Collins  tenuto in una conferenza SMX. Collins descrive alcune importanti verità tecniche (e non solo) sul funzionamento del motore di ricerca. Alla traduzione, il prode Vaccari aggiunge ampie e interessantissime considerazioni personali. Da leggere.

Il terzo modo che conosco è fornire un punto di vista completamente diverso, che al di là del dato tecnico, dica qualcosa di vero agli utenti e li metta a pensare. Se ricordi il mio articolo in cui parlo della verità come strategia SEO, sai già benissimo che mi riferisco a quelle informazioni forse un po’ scomode che tuttavia danno credibilità ad un professionista. Se tutti i siti web degli studi dentistici pubblicano informazioni sul fatto che la pulizia dei denti non fa male e io scrivo un post dicendo che invece è dolorosa, argomentando per bene, gli utenti attribuiranno a quello studio dentistico una credibilità maggiore finendo per navigarne di più e più approfonditamente le pagine, menzionarlo nei forum e perché no, dargli qualche backlink.

Internet non è la verità

Oggi vorrei provare a posizionarmi per “come funziona Google” spiegandoti una verità semplice e cioè che Google premia la verità in un internet che mente di continuo. Ti condivido volentieri un post sullo scomparso Gianni Degli Antoni , scritto da Simone Righini. La frase del prof che mi ha colpito maggiormente è stata “internet non è la verità”. Significa due cose, la prima è che le persone pubblicano su internet quel che ritengono opportuno senza curarsi troppo del fatto che ci sia o meno verità, la seconda è che se molti vogliono sapere come curare la carie da soli, (cosa impossibile), TUTTI vogliono conoscere la verità, che non è banalmente “non si può fare”, ma “trova il coraggio per andare dal dentista”.

Intenzioni di ricerca

Un aspetto interessantissimo del funzionamento di Google.it è che il suo algoritmo principale trova il modo di attribuire un buon posizionamento per i contenuti effettivamente più interessanti. Quel che c’è da capire è cosa si intende in verità per “contenuti interessanti”. Come sai faccio una differenza netta (spesso criticata) tra contenuto di qualità e contenuto utile.

Puoi realizzare la guida più ricca, ma se gli utenti non cercano un testo approfondito su quell’argomento in particolare, un testo semplicemente lungo, per quanto circostanziato e certamente di qualità, non sortirà alcun effetto positivo. Google quindi si accorge se per una data query gli utenti vogliono il classico “spiegone” (grazie Jacopo) oppure no.

Ora mi fermo un attimo e ti riporto gli esiti di un test sullo sviluppo dei concetti (termini) in pagina, condotto a 4 mani col Vaccari.

L’articolo del Vaccari su Collins, quello che ho già linkato prima, fu riaperto e al suo interno fu sviluppata la distribuzione del termine “verità”, esattamente come qui. Nel giro di pochi giorni l’articolo di Emanuele è risalito dalla sesta pagina in cui si trovava fino alla seconda guadagnando molta rilevanza.

Perché il suo contenuto crebbe e il mio sparì? Ovvio che la verità non è da cercare in un solo fattore, ma nel caso specifico mi sono fatto l’idea che lo spiegone sia l’arma vincente dell’articolo di Emanuele. Il suo lavoro viene premiato perché Google sa bene che gli utenti interessati all’argomento sono SEO o aspiranti tali in cerca di risorse da studiare. Cosa succederebbe a questo punto se periodicamente riaprissi quest’articolo e lo aggiornassi ampliandolo con nuovi riscontri su quello che studio? Magari un link nella Sidebar ne farebbe una risorsa più accessibile tanto per gli utenti quanto per Google.it (che bastardo che sono).

Espansione della query e topical trust

Ora pensa un momento a Discover, Ads, MyBusiness e alle mille altre piattaforme di Google, ciascuna con il proprio funzionamento e le proprie caratteristiche peculiari. Se domani mattina si verificasse un evento per cui il funzionamento di Google Discover diventasse per qualche motivo più importante rispetto a quello delle altre piattaforme, allora una buona guida su “come funziona Google Discover” rischierebbe di posizionarsi anche per la chiave centrale “come funziona Google”.

Il “superspiegone” in questo caso andrebbe a sviluppare proprio quel topical trust tale da costituire una buona risposta a una domanda diffusa. Un link da quella pagina sarebbe un buon affare. 

È quindi sempre una buona idea espandere la query, in questo caso creando articoli che spiegano come funziona Google Maps, Google Ads, Google Foto, Google eBook etc. proprio perché il motore di ricerca tenta di cogliere tutti i motivi possibili per cui un utente può usare quella query. In ultimo puoi collegare tutte queste pagine tra loro con in link interni fino a creare una rete che permetta agli utenti di spostarsi agevolmente tra una pagina e l’altra.

Freshness

La freschezza di un contenuto è un aspetto spesso decisivo per quanto riguarda il posizionamento organico. Per molti ambiti di ricerca, un contenuto aggiornato è decisamente preferibile ad uno vecchio e con informazioni obsolete. Google lo sa, infatti tende a dare spinta ai contenuti nuovi appena vengono pubblicati. Tale spinta funziona anche come un test per capire se gli utenti lo ritengono utile. Google infatti valuta la qualità di un contenuto anche dandogli immediatamente molta visibilità e osservando a campione i segnali comportamentali che ne vengono fuori, come il CTR in serp, il tempo di permanenza e le page views per sessione.

La spinta data dalla freshness non si verifica sempre. Mi accorgo spesso che questa storia dell’aggiornamento dei contenuti sfugge di mano, perché vedo una corsa frenetica all’update di pagine che in realtà riguardano temi non soggetti a variazioni, come ricette di cucina, psicologia e benessere in generale. Se è vero che la carbonara si prepara – per fortuna – ancora come 10 anni fa, moltissimi ambiti come l’informatica, (ahimé) la SEO, il diritto, la moda e tanti altri, richiedono aggiornamenti continui, pena la perdita di interesse da parte degli utenti. Insomma, giocare con la freshness va bene, ma non sempre e comunque.

A che serve la freschezza dei contenuti

Tempo fa scrissi un articolo che fin dall’inizio vide Google comportarsi esattamente come descritto prima. Il post link building gratis si posizionò in terza pagina su Google per Link Buildinge in prima pagina per Link building gratis, provocando disappunto in alcuni colleghi che forse dovrebbero seguirmi di meno e concentrarsi di più su Come funziona Google. In sostanza anche qui un discreto posizionamento nelle prime 24 ore, cui seguì un calo anche brusco entro le 36 ore.

Questa freshness per cui il nuovo contenuto ottenne temporaneamente un buon posizionamento, doveva servire a vedere se la “botta” di visibilità era tale da generare visite e altri segnali di rilevanza, ma durò talmente poco da non lasciare agli utenti il tempo di decidere se la risorsa meritasse o meno. Insomma, la freshness non serve solo per valutare il comportamento degli utenti, ma anche più banalmente per dare spazio alle novità in serp… sempre più affollate.

Quality rater umano

Sulla quarta di copertina del Manuale di Seogardening ho scritto chiaramente che “almeno in parte gli algoritmi di attribuzione ranking di Google sono fuori controllo“, da cui ho più volte asserito che i test SEO sono virtualmente inutili. Lo stesso Collins afferma “we still don’t understand what it (Rankbrain) is doing exactly“, mettendo le mani avanti rispetto alla black box che Google sta diventando perfino per i suoi ingegneri. Quello che penso e scrivo da tempo, è che Google.it si muove per una strada al termine della quale sarà perfettamente in grado di sostituire un quality rater umano, vale a dire che darà importanza alla capacità di una pagina web, di soddisfare la richiesta specifica dell’utente. Come farà? Attraverso i segnali interni come il testo ed esterni come backlink e menzioni, attraverso la valutazione dei dati di navigazione, ma soprattutto, vedo un futuro in cui Google aggiungerà a quelli classici, un nuovo importante fattore di ranking: la valutazione complessiva dell’aspetto della risorsa in funzione dell’argomento e del tipo di ricerca collegata. È questo in sintesi estrema il lavoro di un quality rater, ed è questa la strada. Chiaro che i test continueremo a farli. Giorno dopo giorno ci avviciniamo sempre di più a una realtà che comunque non possiamo toccare… in questo senso Google è una straordinaria metafora della condizione umana, non trovi?

A proposito di questo, ho preparato un piccolo brano Jungle e l’ho dedicato a Google. Mi piacerebbe fartelo ascoltare, l’ho chiamato proprio Google.it

Cos’è il deepcrawl?

Talvolta i risultati oscillano secondo quella che chiamiamo Google Dance. Per la maggior parte del tempo – a meno che non parliamo di siti web di notizie – i bot di Google sono impegnati nella pratica del deep crawl, ovvero la scansione di tutti i percorsi interni (accessibili) dei siti web. Il ranking non dipende dalle valutazioni sulla singola pagina bensì da quelle sulla singola pagina rispetto a tutte le altre pagine. Solo una volta terminato il deep crawl e computata l’intera struttura dei percorsi interni, Google può stabilire il posizionamento in funzione dei fattori endogeni. Tuttavia c’è un’altra questione che riguarda i diversi data center sparsi sul pianeta, segreti e sorvegliatissimi.

Cos’è e come funziona un data center

I data center di Google sono immense server farm localizzate in punti diversi del mondo. Il loro compito è archiviare tutto il web scansionabile e computare tutte le query che gli vengono rivolte ogni giorno. Nel paragrafo precedente ho parlato di Deepcrawl, ovvero della scansione in profondità di un sito web, solo che non ho detto a carico di quale data center avviene. Il fatto è che uno stesso sito web viene scansionato e conservato in diversi data center, non soltanto in uno di essi, per motivi di sicurezza e accessibilità.

La verità sulla Google dance

La Google dance, vale a dire l’instabilità nel posizionamento dei risultati di ricerca, tipica del primo mese dalla pubblicazione di un nuovo contenuto sull’internet, dipende spesso dal fatto che la query di ricerca è stata computata da un data center che non ha ancora allineato la valutazione della singola pagina sul deep crawling dell’intero sito web. Ecco come un risultato può apparire in terza posizione da Palermo per una certa chiave (non geolocalizzata) e in settima per la stessa query fatta da Milano: le due query potrebbero essere arrivate a due datacenter diversi non allineati sulla scansione complessiva del sito web.

Ringrazio Christian Zerjal per avermi spiegato questo processo che finalmente svela la verità su come funziona Google, almeno rispetto alla Google dance. Certo, esistono brevetti di Google che abbassano il ranking per i contenuti quando vengono riaperti troppo di frequente per modifiche forzate (specie sui link), esiste il famoso effetto sandbox per cui una pagina web viene retrocessa a tempo indeterminato per poi risalire in seguito, ma tutti i brevetti e tutte le leggi universali vere o presunte che siano, devono fare i conti con il deep crawling e l’archiviazione differenziata su più datacenter. Questa è la vera base del funzionamento hardware di Google.

Come “vuole” funzionare Google

In conclusione, provo a fare una riflessione sulle modifiche occorse al core di Google negli ultimi anni. Come cambia Google con l’aumento delle risorse di calcolo rese disponibili dai computer quantistici? Sulla carta Google non sarebbe semplicemente in condizione di fare calcoli più rapidamente, ma proprio in modo diverso. È grazie a questo balzo in avanti che Google ha potuto integrare l’algoritmo Penguin nel computo dei meccanismi di valutazione del ranking. Se prima il “pinguino” veniva lanciato solo ogni tanto e puniva interi siti web trovati con il profilo di link in ingresso sporco, oggi agisce in tempo reale (e solo quando serve davvero) ed è molto più accurato di prima nel colpire solo le pagine e le sezioni che ricevono i link, in modo dunque più granulare che in passato.

Un grosso cambiamento avvenne nel 2017 con il Panda/Fred update che fu un quality update a tutti gli effetti.

La cosa più interessante è che da quel momento in avanti non ci sono più stati i risultati stabili a cui eravamo abituati, ma le serp non si sono praticamente più stabilizzate. Questo fu un segnale rivelatore del fatto che Google non si limitava più a lanciare algoritmi periodicamente, ma ora funzionava proprio così. Da quel momento i risultati divennero sempre più dinamici in funzione di quanto Google riusciva a percepire l’interesse reale delle persone per le diverse pagine web.

L’idea che mi sono fatto è che ad oggi per raggiungere quest’ordine di cose si faccia analisi comportamentale (per lo meno) a campione allo scopo di cogliere quante più informazioni utili a carpire il reale interesse per una risorsa trovata su Google. A tale scopo verrebbero utilizzati Chrome e Android, rispettivamente il browser web e il sistema operativo mobile di Google, che a certe condizioni fornirebbero informazioni approfondite su cosa piace agli utenti e cosa no.

I backlink restano voti di fiducia importanti, ma se Google vuole essere il miglior motore di ricerca possibile, deve fornire i risultati giudicati di maggior valore dalle persone normali… e le persone normali non dispongono di un sito web da cui farti arrivare un backlink, non so se mi spiego. L’analisi dei comportamenti degli utenti è l’unica vera strada per arrivare alla determinazione del reale valore di una pagina web, ancorché tale valore percepito sia appunto variabile in funzione di quello che succede là fuori, nel mondo popolato dalle persone. Ecco dunque perché in serp si muove tutto ed ecco come Google vuole funzionare.

Ecco come funziona Google.it

Ti sarai accorto che qui non parliamo di crawling, parsing, ranking e “twerking”, anche perché la guida diEnrico Altavilla fa già un ottimo lavoro in questo senso, né tantomeno io pretendo di conoscere gli aspetti tecnici del funzionamento dei motori di ricerca meglio di Enrico, che ritengo un luminare. Il mio approccio vuole integrare quello tecnico di “basso livello”, riflettendo sugli aspetti che pesano indirettamente sul ranking, come il tempo di permanenza in pagina, la frequenza di rimbalzo, il numero di pageviews e tutti i dati tracciabili che possono risentire di un approccio ragionato sul perché oltre che sul come.

Noterai che in questo mio articolo ho usato spesso la parola verità, che non è una parola chiave, ma appunto un termine correlato di quelli che purtroppo i software come Semrush (sono il peggior brand ambassador della storia) non riescono ancora a darci, distribuendolo in modo più o meno regolare nel testo. Guarda, la scrivo ancora: verità. Oltre questo, ti sarai accorto che l’articolo presenta anche una co-citation di contenuti interessanti sul funzionamento di Google, ma non tutti posizionati per la chiave come funziona Google e allo stesso tempo sviluppa una menzione multipla di nomi rilevanti rispetto all’argomento.

Conclusioni e bibliografia

La SEO è fatta di struttura scansionabile, codice pulito e strategia di visibilità organica, ma anche di verità e di testi che sappiano catturare l’attenzione. Ricorda che non tutto ciò che è vero vince questa battaglia, ma ciò che è vero vince la guerra. Ti lascio una risorsa in inglese di Eric Schmidt e Jonathan Rosenberg, un libro intitolato how Google Works . Non c’entra niente con quest’articolo, ma vuoi mettere il riferimento bibliografico finale in inglese?

Non è che visto che sono “indiretti” spingono poco. È la forza dei segnali deboli.