Come funziona Google.it, tutta la verità

by francesco 9.526 views5

Quest’articolo prova a fare due cose, posizionarsi per la chiave nel titolo e offrire uno spunto per cogliere un aspetto importante del funzionamento di Google.

come funziona google-it
Come funziona Google

Aggiornamento 1° giugno (Intenzioni di ricerca)

Aggiornamento 10 giugno (freshness)

Aggiornamento 6 luglio (Deep Crawl e Datacenter)

Aggiornamento dell’11 agosto 2017 (Come vuole funzionare Google)

Google.it offre visibilità gratuita e traffico alle fonti di contenuti che aggiungono valore alla vita delle persone. È un motore di ricerca che classifica e filtra le informazioni da mostrare nelle sue pagine come risposte alle interrogazioni degli utenti o “query”.

Una query è qualunque cosa un utente decida di scrivere nella barra di ricerca, anche una sola lettera, anche una parola chiave dal volume di ricerca altissimo, anche la domanda “qual è la verità sugli alieni?”.

 

Rilevanza e posizionamento

Conosco tre modi per rendere un contenuto rilevante, quindi meritevole di un buon posizionamento su Google.it. Il primo è fornire in assoluto la risorsa più completa. Guarda ad esempio che bel lavoro ha fatto Nozze speciali per arrivare primo sulla chiave “come organizzare un matrimonio”, osserva quanto è chiara la homepage e quanto risponde a tutte le possibili domande. La stessa cosa vale per NeoSeo che si è posizionato in prima pagina per la chiave secca “SEO” fornendo una guida similmente architettata.

Il secondo modo che conosco è costruire un contenuto pur esteso e circostanziato, tuttavia non genericamente orientato a mostrare come si fa una cosa, ma declinato intorno ad un evento importante che si è tenuto sull’argomento. Mi viene in mente la mega risorsa del Vaccari, il cui titolo è proprio Come funziona Google, in cui Emanuele ha tradotto l’intervento di Collins all’ultimo SMX. Collins descrive alcune importanti verità tecniche (e non solo) sul funzionamento del motore di ricerca. Alla traduzione il prode Vaccari aggiunge ampie e interessantissime considerazioni personali. Da leggere.

Il terzo modo che conosco è fornire un punto di vista completamente diverso, che al di là del dato tecnico, dica qualcosa di vero agli utenti e li metta a pensare. Se ricordi il mio articolo in cui parlo della verità come strategia SEO, sai già benissimo che mi riferisco a quelle informazioni forse un po’ scomode che tuttavia danno credibilità ad un professionista. Se tutti i siti web degli studi dentistici pubblicano informazioni sul fatto che la pulizia dei denti non fa male e io scrivo un post dicendo che invece è dolorosa, argomentando per bene, gli utenti attribuiranno a quello studio dentistico una credibilità maggiore finendo per navigare di più e più approfonditamente le sue pagine, menzionarlo nei forum e perché no, dargli qualche link.

 

Internet non è la verità

Oggi vorrei provare a posizionarmi per “come funziona Google” spiegandoti una verità semplice e cioè che Google premia la verità in un internet che mente di continuo. Proprio stamattina ho letto un post sullo scomparso Gianni Degli Antoni , scritto da Simone Righini. La frase del prof che mi ha colpito maggiormente è stata “internet non è la verità”. Significa due cose, la prima è che le persone pubblicano su internet quel che ritengono opportuno senza curarsi troppo del fatto che ci sia o meno verità, la seconda è che se molti vogliono sapere come curare la carie da soli, (cosa impossibile), TUTTI vogliono conoscere la verità, che non è banalmente “non si può fare”, ma “trova il coraggio per andare dal dentista”.

 

Intenzioni di ricerca

(aggiornamento del 1° giugno 2016) Un aspetto interessantissimo del funzionamento di Google.it è che il suo algoritmo principale trova il modo di attribuire un buon posizionamento per i contenuti effettivamente più interessanti. Quel che c’è da capire è cosa si intende in verità per “contenuti interessanti”. Come sai faccio una differenza netta (spesso criticata) tra contenuto di qualità e contenuto utile.

Puoi realizzare la guida più ricca, ma se gli utenti non cercano un testo approfondito su quell’argomento in particolare, un testo semplicemente lungo, per quanto circostanziato e certamente di qualità, non sortirà alcun effetto positivo. Google quindi si accorge se per una data query gli utenti vogliono il classico “spiegone” oppure no.

E torniamo a questo test sul posizionameto di “come funziona Google”. Nelle ultime due settimane ho monitorato l’andamento dell’articolo che stai leggendo. Nei primi due giorni si è posizionato molto bene per “Come funziona Google” (14° risultato) e addirittura per Google.it (9° risultato non cercato), per poi scendere fino alla sesta pagina.

Nel frattempo, l’articolo del Vaccari su Collins, quello che ho già linkato prima, è stato riaperto e al suo interno è stata sviluppata la distribuzione del termine “verità”, esattamente come qui. Nel giro di pochi giorni l’articolo di Emanuele è risalito dalla sesta pagina in cui si trovava fino alla seconda dove compare tutt’ora!

 

Perché il suo contenuto è cresciuto e il mio è sparito? Ovvio che la verità non è da cercare in un solo fattore, ma nel caso specifico mi sono fatto l’idea che lo spiegone sia l’arma vincente dell’articolo di Emanuele. Il suo lavoro viene premiato perché Google sa bene che gli utenti interessati all’argomento sono SEO o aspiranti tali in cerca di risorse da studiare. Cosa succederebbe a questo punto se periodicamente riaprissi quest’articolo e lo aggiornassi ampliandolo con nuovi riscontri su quello che studio? Magari migliorerebbe, ma considerando che pubblico quantità imbarazzanti di articoli, dovrei anche aver cura di non farlo sprofondare troppo negli enormi archivi di Seogarden. Magari un link nel Sidebar ne farebbe una risorsa più accessibile tanto per gli utenti quanto per Google.it (che bastardo che sono).

 

Analisi della prima serp: Aranzulla e Google+

Interessantissimo Pianetasocial.it che merita una menzione d’onore, perché ha colto meglio di altri una search intent nascosta a chi ragiona ingenuamente su come funziona Google. Il sito web si posiziona benissimo per la chiave di questo test (sono secondi sotto Google) perché sviluppa una guida lunga e ricchissima su come funziona Google+. È dunque evidente che la maggior parte delle persone che fanno questa ricerca su Google sono interessate al funzionamento del social layer (guai a chiamarlo social network) Google Plus. Il “superspiegone” in questo caso sviluppa proprio quel topical trust tale da costituire una buona risposta a una domanda diffusa. Non è tanto il sito web, quanto quell’articolo ad essere trust. Un link da quella pagina è un buon affare. Ci ha provato Aranzulla sulla stessa search intent, senza eguagliare la performance di Pianetasocial. Poi vabbé, sulla chiave “come funziona Google plus” vince Aranzulla posizionandosi prima di Pianetasocial. I meandri dell’internet!

A seguire, nella seconda pagina, trovi risultati che spiegano come funziona Google Now, Google AdWords, Google Foto, Google eBook etc. a conferma del fatto che il motore di ricerca tenta di cogliere tutti i motivi possibili per cui un utente può usare quellaa query. L’unico contenuto tecnico non facente capo a Google è un post di Enrico Altavilla che oltre ad essere meraviglioso, prende anche segnali praticamente da chiunque. Solo nel mio blog viene menzionato praticamente ogni lunedì nelle interviste.

 

Freshness

(aggiornamento del 10 giugno 2016)

A distanza di poco più di una settimana, continua il racconto di questa lunga storia SEO, che si dice appassioni i più. Riassumendo brevemente, l’articolo che stai leggendo era passato dalla seconda pagina per “come funziona Google” alla sesta nel giro di due settimane, poi a seguito dell’aggiornamento del 1° giugno era risalito in terza pagina, per poi ripiombare giù fino alla settima dove si trova tutt’ora.

Ti ricordo che questo test funziona unicamente sull’osservazione dei fattori endogeni e nemmeno di tutti, poiché a livello strutturale non posso più aspettarmi tanto da Seogarden visti i problemi SEO di questa vecchia Joomla 1.5. In definitiva finché non metto online la nuova versione di Seogarden, mi rimane da testare solo (alcuni) fattori onpage. Vabbè.

 

A che serve la freschezza dei contenuti

Due giorni fa ho scritto un articolo che fin dall’inizio ha visto Google comportarsi esattamente come per questo test. Il post link building gratis si è posizionato in terza pagina su Google per Link Building e in prima pagina per Link building gratis, provocando disappunto in alcuni colleghi che forse dovrebbero seguirmi di meno e concentrarsi di più su Come funziona Google. In sostanza anche qui un discreto posizionamento nelle prime 24 ore, cui potrebbe seguire un calo anche brusco entro le 36 ore. Questafreshness per cui il nuovo contenuto ottiene temporaneamente un buon posizionamento, dovrebbe servire a vedere se la “botta” di visibilità richiama visite esegnali (e di che genere), ma a me sembra che duri talmente poco da non lasciare agli utenti il tempo di decidere se la risorsa merita. Insomma, la freshness potrebbe non servire a Google per valutare il comportamento degli utenti, ma per altri scopi sui quali al momento mantengo uno spartano riserbo.

 

Quality rater umano

Sulla quarta di copertina del Manuale di Seogardening ho scritto chiaramente che “almeno in parte gli algoritmi di attribuzione ranking di Google sono fuori controllo“, da cui ho più volte asserito che i test SEO sono virtualmente inutili. Lo stesso Collins afferma “we still don’t understand what it (Rankbrain) is doing exactly“, mettendo le mani avanti rispetto alla black box che Google sta diventando pure per i suoi ingegneri. Quello che penso e scrivo da tempo (esattamente come il Vaccari), è che Google.it si muove per una strada al termine della quale sarà perfettamente in grado di sostituire un quality rater umano, vale a dire che darà importanza su tutto alla capacità di una pagina web di soddisfare la richiesta specifica dell’utente. Come farà? Attraverso i segnali interni come il testo ed esterni come link e menzioni, attraverso la valutazione dei dati di navigazione, ma soprattutto, vedo un futuro in cui Google aggiungerà a quelli classici, un nuovo importante fattore di ranking: la valutazione complessiva dell’aspetto della risorsa in funzione dell’argomento e del tipo di ricerca collegata. È questo in sintesi estrema il lavoro di un quality rater, ed è questa la strada. Chiaro che i test continueremo a farli. Giorno dopo giorno ci avviciniamo sempre di più a una realtà che comunque non possiamo toccare… in questo senso Google è una straordinaria metafora della condizione umana, non trovi?

A proposito di questo, ho prodotto un brano musicale e l’ho dedicato a questo test. Mi piacerebbe fartelo ascoltare, l’ho chiamato proprio Google.it

Cos’è il deepcrawl?

 (aggiornamento del 6 luglio 2016)

A quasi un mese di distanza dall’ultimo aggiornamento, torniamo a parlare di come funziona Google, spiegando il motivo per cui talvolta i risultati oscillano secondo quella che chiamiamo Google Dance. Per la maggior parte del tempo i bot di Google sono impegnati nella pratica del deep crawl, ovvero la scansione di tutte le pagine interne (accessibili) dei siti web. Il ranking non dipende dalle valutazioni sulla singola pagina bensì da quelle sulla singola pagina rispetto a tutte le altre pagine. Solo una volta terminato il deep crawl e computata l’intera struttura dei link interni, Google può stabilire il posizionamento in funzione dei fattori endogeni. Tuttavia c’è un’altra questione che riguarda i diversi data center sparsi sul pianeta, segreti e sorvegliatissimi.

 

Cos’è e come funziona un data center

I data center di Google sono immense server farm localizzate in punti diversi del mondo. Il loro compito è archiviare tutto il web scansionabile e computare tutte le query che gli vengono rivolte ogni giorno. Nel paragrafo precedente ho parlato di Deepcrawl, ovvero della scansione in profondità di un sito web, solo che non ho detto a carico di quale data center avviene. Il fatto è che uno stesso sito web viene scansionato e asorbito in diversi data center, non soltanto in uno di essi, per motivi di sicurezza e accessibilità.

 

La verità sulla Google dance

La Google dance, vale a dire l’instabilità nel posizionamento dei risultati di ricerca tipica del primo mese dalla pubblicazione di un nuovo contenuto sull’internet, dipende spesso dal fatto che la query di ricerca è stata computata da un data center che non ha ancora allineato la valutazione della singola pagina sul deep crawling dell’intero sito web. Ecco come un risultato può apparire in terza posizione da Palermo per una certa chiave (non geolocalizzata) e in settima per la stessa query fatta da Milano: le due query potrebbero essere arrivate a due datacenter diversi non allineati sulla scansione complessiva del sito web.

Ringrazio Christian Zerjal per avermi spiegato questo processo che finalmente svela la verità su come funziona Google, almeno rispetto alla Google dance. Certo, esistono brevetti di Google che abbassano il ranking per i contenuti quando vengono riaperti troppo di frequente per modifiche forzate (specie sui link), esiste il famoso effetto sandbox per cui una pagina web viene retrocessa a tempo indeterminato per poi risalire in seguito, ma tutti i brevetti e tutte le leggi universali vere o presunte che siano, devono fare i conti con il deep crawling e l’archiviazione differenziata su più datacenter. Questa è la vera base del funzionamento hardware di Google.

 

Come “vuole” funzionare Google

(aggiornamento dell’11 agosto 2017)

Premessa all’upgrade: Questa mattina ho aggiornato la data di pubblicazione dell’articolo, oltre che sviluppare un cospicuo aggiornamento.

Ad oltre un anno di distanza dall’ultimo aggiornamento, riapro questo articolo (che ormai è una pagina di diario) per fare una riflessione sulle modifiche occorse al core di Google nell’ultimo anno. Rispetto a un anno fa sono successe tante cose a partire dall’aumento delle risorse di calcolo di Google che in virtù dei computer quantistici non sarebbe semplicemente in condizione di fare calcoli più velocemente, ma proprio in modo diverso. Grazie a questo balzo in avanti pare che Google abbia potuto integrare l’algoritmo Penguin nel computo dei meccanismi di valutazione del ranking. Se prima il “pinguino” veniva lanciato una tantum e puniva interi siti web trovati con il profilo di link in ingresso sporco, oggi agisce in tempo reale ed è molto più accurato di prima nel colpire solo le pagine e le sezioni che ricevono i link, in modo dunque più granulare che in passato.

Dal mese di marzo 2017 abbiamo assistito ad un’autentica rivoluzione che ha visto retrocedere nelle serp tanti siti web storicamente ben posizionati. Ne ho scritto ampiamente riferendomi al Panda/Fred update che sarebbe un quality update a tutti gli effetti. Pare che a perdere terreno siano i siti web con contenuti duplicati, ridondanti e/o palesemente falsi e poco autorevoli.

La cosa più interessante è che le oscillazioni su tantissime serp vanno avanti proprio da marzo e non si sono mai stabilizzate. Questo è un segnale importante del fatto che Google non si limita più a lanciare algoritmi periodicamente, ma ora funziona proprio così. I risultati saranno sempre mutevoli in funzione di quanto Google riuscirà a percepire l’interesse reale delle persone per le diverse pagine web. L’idea che mi sono fatto è che per raggiungere quest’ordine di cose si faccia analisi comportamentale (per lo meno) a campione allo scopo di cogliere quante più informazioni utili a carpire il reale interesse per una risorsa trovata su Google. A tale scopo verrebbero utilizzati Chrome e Android, rispettivamente il browser web e il sistema operativo mobile di Google, che a certe condizioni fornirebbero informazioni approfondite su cosa piace agli utenti e cosa no.

I link restano voti di fiducia importanti, ma se Google vuole essere il miglior motore di ricerca possibile, deve fornire i risultati giudicati di maggior valore dalle persone normali… e le persone normali non dispongono di un sito web da cui farti arrivare un link, non so se mi spiego. L’analisi dei comportamenti degli utenti è l’unica vera strada per arrivare alla determinazione del reale valore di una pagina web, ancorché tale valore percepito sia appunto variabile in funzione di quello che succede là fuori, nel mondo popolato dalle persone. Ecco dunque perché in serp si muove tutto ed ecco come Google vuole funzionare.

 

Ecco come funziona Google.it

Ti sarai accorto che qui non parliamo di crawling, parsing, ranking e “twerking”, anche perché la guida di Enrico Altavilla fa già un ottimo lavoro in questo senso, né tantomeno io pretendo di conoscere gli aspetti tecnici del funzionamento dei motori di ricerca meglio di Enrico, che ritengo un luminare. Il mio approccio vuole integrare quello tecnico di “basso livello”, riflettendo sugli aspetti che pesano indirettamente sul ranking, come il tempo di permanenza in pagina, la frequenza di rimbalzo, il numero di pageviews e tutti i dati tracciabili che possono risentire di un approccio ragionato sul perché oltre che sul come.

Noterai che in questo mio articolo ho usato spesso la parola verità, che non è una parola chiave, ma appunto un termine correlato di quelli che purtroppo i software come Semrush (sono il peggior brand ambassador della storia) non riescono ancora a darci, distribuendolo in modo più o meno regolare nel testo. Guarda, la scrivo ancora: verità. Oltre questo, ti sarai accorto che l’articolo presenta anche una co-citation di contenuti interessanti sul funzionamento di Google, ma non tutti posizionati per la chiave come funziona Google e allo stesso tempo sviluppa una menzione multipla di nomi rilevanti rispetto all’argomento.

 

Conclusioni e bibliografia

La SEO è fatta di struttura scansionabile, codice pulito e strategia di visibilità organica, ma anche di verità e di testi che sappiano catturare l’attenzione. Ricorda che non tutto ciò che è vero vince questa battaglia, ma ciò che è vero vince la guerra. Ti lascio una risorsa in inglese di Eric Schmidt e Jonathan Rosenberg, un libro intitolato how Google Works . Non c’entra niente con quest’articolo, ma vuoi mettere il riferimento bibliografico finale in inglese?

Non è che visto che sono “indiretti” spingono poco. È la forza dei segnali deboli.

  • Davide Taraborrelli

    Anche io mi occupo di SEO, ma devo dire che questo e uno dei migliori articoli che ho mai avuto il piacere di leggere. Esposto in maniera chiara e precisa, completo e ricco di informazioni. Davvero bravo, Francesco, dobbiamo tutti prendere esempio da te! 🙂

  • Ottimo francesco sei terzo con la Key “come funziona google” e 17° con “google come funziona”. Io punterei anche su questa visto che è più cercata.

    • Grazie. Per le 2 chiavi Semrush mi vede rispettivamente 7° e 14°. Visivamente (in incognito) mi trovo 5° e 10°. Ci fai caso a come persone e software diversi vedano posizionamenti diversi? Per te cosa significa?

      • Be le ricerche vanno fatte in incognito altrimenti si falsa tutto. Dico la mia anche se parlare di Seo con te la vedo difficile visto il divario di informazioni che ci separa.
        Comunque Google ti manda su e giù in base a diversi fattori… Ora io ti vedo quinto e decimo.