Come funziona Google.it, tutta la verità

by francesco 3.946 views2

come funziona google-it
come funziona google-it

Quest’articolo prova a fare due cose, posizionarsi per la chiave nel titolo e offrire uno spunto per cogliere un aspetto importante del funzionamento di Google.

Aggiornamento 1° giugno (Intenzioni di ricerca)

Aggiornamento 10 giugno (freshness)

Aggiornamento 6 luglio (Deep Crawl e Datacenter)

Google.it offre visibilità gratuita e traffico alle fonti di contenuti che aggiungono valore alla vita delle persone. È un motore di ricerca che classifica e filtra le informazioni da mostrare nelle sue pagine come risposte alle interrogazioni degli utenti o “query”.

Una query è qualunque cosa un utente decida di scrivere nella barra di ricerca, anche una sola lettera, anche una parola chiave dal volume di ricerca altissimo, anche la domanda “qual è la verità sugli alieni?”.

Rilevanza e posizionamento

Conosco tre modi per rendere un contenuto rilevante, quindi meritevole di un buon posizionamento su Google.it. Il primo è fornire in assoluto la risorsa più completa. Guarda ad esempio che bel lavoro ha fatto Nozze specialiper arrivare primo sulla chiave “come organizzare un matrimonio”, osserva quanto è chiara la homepage e quanto risponde a tutte le possibili domande. La stessa cosa vale per NeoSeo che si è posizionato in prima pagina per la chiave secca “SEO” fornendo una guida similmente architettata.

Il secondo modo che conosco è costruire un contenuto pur esteso e circostanziato, tuttavia non genericamente orientato a mostrare come si fa una cosa, ma declinato intorno ad un evento importante che si è tenuto sull’argomento. Mi viene in mente la mega risorsa delVaccari, il cui titolo è proprio Come funziona Google, in cui Emanuele ha tradotto l’intervento di Collins all’ultimo SMX. Collins descrive alcune importanti verità tecniche (e non solo) sul funzionamento del motore di ricerca. Alla traduzione il prode Vaccari aggiunge ampie e interessantissime considerazioni personali. Da leggere.

Il terzo modo che conosco è fornire un punto di vista completamente diverso, che al di là del dato tecnico, dica qualcosa di vero agli utenti e li metta a pensare. Se ricordi il mio articolo in cui parlo della verità come strategia SEO, sai già benissimo che mi riferisco a quelle informazioni forse un po’ scomode che tuttavia danno credibilità ad un professionista. Se tutti i siti web degli studi dentistici pubblicano informazioni sul fatto che la pulizia dei denti non fa male e io scrivo un post dicendo che invece èdolorosa, argomentando per bene, gli utenti attribuiranno a quello studio dentistico una credibilità maggiore finendo per navigare di più e più approfonditamente le sue pagine, menzionarlo nei forum e perché no, dargli qualche link.

Internet non è la verità

Oggi vorrei provare a posizionarmi per “come funziona Google” spiegandoti una verità semplice e cioè che Google premia la verità in un internet che mente di continuo. Proprio stamattina ho letto un post sullo scomparso Gianni Degli Antoni , scritto da Simone Righini. La frase del prof che mi ha colpito maggiormente è stata “internet non è la verità”. Significa due cose, la prima è che le persone pubblicano su internet quel che ritengono opportuno senza curarsi troppo del fatto che ci sia o meno verità, la seconda è che se molti vogliono sapere come curare la carie da soli, (cosa impossibile), TUTTI vogliono conoscere laverità, che non è banalmente “non si può fare”, ma “trova ilcoraggio per andare dal dentista”.

Intenzioni di ricerca

(aggiornamento del 1° giugno) Un aspetto interessantissimo del funzionamento di Google.it è che il suo algoritmo principale trova il modo di attribuire un buon posizionamento per i contenuti effettivamente più interessanti. Quel che c’è da capire è cosa si intende in verità per “contenuti interessanti”. Come sai faccio una differenza netta (spesso criticata) tra contenuto di qualità e contenuto utile.

Puoi realizzare la guida più utile, ma se gli utenti non cercano un testo approfondito su quell’argomento in particolare, un testo semplicemente lungo, per quanto circostanziato e certamente di qualità, non sortirà alcun effetto positivo. Google quindi si accorge se per una data query gli utenti vogliono il classico “spiegone” oppure no.

E torniamo a questo test sul posizionameto di “come funziona Google”. Nelle ultime due settimane ho monitorato l’andamento dell’articolo che stai leggendo. Nei primi due giorni si è posizionato molto bene per “Come funziona Google” (14° risultato) e addirittura per Google.it(9° risultato non cercato), per poi scendere fino alla sesta pagina.

Nel frattempo, l’articolo del Vaccari su Collins, quello che ho già linkato prima, è stato riaperto e al suo interno è stata sviluppata la distribuzione del termine “verità”, esattamente come qui. Nel giro di pochi giorni l’articolo di Emanuele è risalito dalla sesta pagina in cui si trovava fino alla seconda dove compare tutt’ora!

 

Perché il suo contenuto è cresciuto e il mio è sparito? Ovvio che la verità non è da cercare in un solo fattore, ma nel caso specifico mi sono fatto l’idea che lo spiegone sia l’arma vincente dell’articolo di Emanuele. Il suo lavoro viene premiato perché Google sa bene che gli utenti interessati all’argomento sono SEO o aspiranti tali in cerca di risorse da studiare. Cosa succederebbe a questo punto se periodicamente riaprissi quest’articolo e lo aggiornassi ampliandolo con nuovi riscontri su quello che studio? Magari migliorerebbe, ma considerando che pubblico quantità imbarazzanti di articoli, dovrei anche aver cura di non farlo sprofondare troppo negli enormi archivi di Seogarden. Magari un link nel Sidebar ne farebbe una risorsa più accessibile tanto per gli utenti quanto per Google.it (che bastardo che sono).

 

Analisi della prima serp: Aranzulla e Google+

Interessantissimo Pianetasocial.it che merita una menzione d’onore, perché ha colto meglio di altri unasearch intent nascosta a chi ragiona ingenuamente su come funziona Google. Il sito web si posiziona benissimo per la chiave di questo test (sono secondi sotto Google) perché sviluppa una guida lunga e ricchissima su come funziona Google+. È dunque evidente che la maggior parte delle persone che fanno questa ricerca su Google sono interessate al funzionamento del social layer (guai a chiamarlo social network) Google Plus. Il “superspiegone” in questo caso sviluppa proprio quel topical trust tale da costituire una buona risposta a una domanda diffusa. Non è tanto il sito web, quanto quell’articolo ad essere trust. Un link da quella pagina è un buon affare. Ci ha provato Aranzulla sulla stessa search intent, senza eguagliare la performance di Pianetasocial. Poi vabbé, sulla chiave “come funziona Google plus” vince Aranzulla posizionandosi prima di Pianetasocial. I meandri dell’internet!

A seguire, nella seconda pagina, trovi risultati che spiegano come funziona Google Now, Google AdWords, Google Foto, Google eBook etc. a conferma del fatto che il motore di ricerca tenta di cogliere tutti i motivi possibili per cui un utente può usare quellaa query. L’unico contenuto tecnico non facente capo a Google è un post di Enrico Altavilla che oltre ad essere meraviglioso, prende anche segnali praticamente da chiunque. Solo nel mio blog viene menzionato praticamente ogni lunedì nelle interviste.

 

Freshness

(aggiornamento del 10 giugno)

A distanza di poco più di una settimana, continua il racconto di questa lunga storia SEO, che si dice appassioni i più. Riassumendo brevemente, l’articolo che stai leggendo era passato dalla seconda pagina per “come funziona Google” alla sesta nel giro di due settimane, poi a seguito dell’aggiornamento del 1° giugno era risalito in terza pagina, per poi ripiombare giù fino alla settima dove si trova tutt’ora.

Ti ricordo che questo test funziona unicamente sull’osservazione dei fattori endogeni e nemmeno di tutti, poiché a livello strutturale non posso più aspettarmi tanto da Seogarden visti i problemi SEO di questa vecchia Joomla 1.5. In definitiva finché non metto online la nuova versione di Seogarden, mi rimane da testare solo fattori onpage. Vabbè.

A che serve la freschezza dei contenuti

Due giorni fa ho scritto un articolo che fin dall’inizio ha visto Google comportarsi esattamente come per questo test. Il post link building gratis si è posizionato in terza pagina su Google per Link Building e in prima pagina per Link building gratis, provocando disappunto in alcuni colleghi che forse dovrebbero seguirmi di meno e concentrarsi di più su Come funziona Google. In sostanza anche qui un discreto posizionamento nelle prime 24 ore, cui potrebbe seguire un calo anche brusco entro le 36 ore. Questafreshness per cui il nuovo contenuto ottiene temporaneamente un buon posizionamento, dovrebbe servire a vedere se la “botta” di visibilità richiama visite esegnali (e di che genere), ma a me sembra che duri talmente poco da non lasciare agli utenti il tempo di decidere se la risorsa merita. Insomma, la freshness potrebbe non servire a Google per valutare il comportamento degli utenti, ma per altri scopi sui quali al momento mantengo uno spartano riserbo.

Quality rater umano

Sulla quarta di copertina del Manuale di Seogardening ho scritto chiaramente che “almeno in parte gli algoritmi di attribuzione ranking di Google sono fuori controllo“, da cui ho più volte asserito che i test SEO sono virtualmente inutili. Lo stesso Collins afferma “we still don’t understand what it (Rankbrain) is doing exactly“, mettendo le mani avanti rispetto alla black box che Google sta diventando pure per i suoi ingegneri. Quello che penso e scrivo da tempo (esattamente come il Vaccari), è che Google.it si muove per una strada al termine della quale sarà perfettamente in grado di sostituire un quality rater umano, vale a dire che darà importanza su tutto alla capacità di una pagina web di soddisfare la richiesta specifica dell’utente. Come farà? Attraverso i segnali interni come il testo ed esterni come link e menzioni, attraverso la valutazione dei dati di navigazione, ma soprattutto, vedo un futuro in cui Google aggiungerà a quelli classici, un nuovo importante fattore di ranking: la valutazione complessiva dell’aspetto della risorsa in funzione dell’argomento e del tipo di ricerca collegata. È questo in sintesi estrema il lavoro di un quality rater, ed è questa la strada. Chiaro che i test continueremo a farli. Giorno dopo giorno ci avviciniamo sempre di più a una realtà che comunque non possiamo toccare… in questo senso Google è una straordinaria metafora della condizione umana, non trovi?

A proposito di questo, ho prodotto un brano musicale e l’ho dedicato a questo test. Mi piacerebbe fartelo ascoltare, l’ho chiamato proprio Google.it

Cos’è il deepcrawl?

 (aggiornamento del 6 luglio)

A quasi un mese di distanza dall’ultimo aggiornamento, torniamo a parlare di come funziona Google, spiegando il motivo per cui talvolta i risultati oscillano secondo quella che chiamiamo Google Dance. Per la maggior parte del tempo i bot di Google sono impegnati nella pratica del deep crawl, ovvero la scansione di tutte le pagine interne (accessibili) dei siti web. Il ranking non dipende dalle valutazioni sulla singola pagina bensì da quelle sulla singola pagina rispetto a tutte le altre pagine. Solo una volta terminato il deep crawl e computata l’intera struttura dei link interni, Google può stabilire il posizionamento in funzione dei fattori endogeni. Tuttavia c’è un’altra questione che riguarda i diversi data center sparsi sul pianeta, segreti e sorvegliatissimi.

Cos’è e come funziona un data center

I data center di Google sono immense server farm localizzate in punti diversi del mondo. Il loro compito è archiviare tutto il web scansionabile e computare tutte le query che gli vengono rivolte ogni giorno. Nel paragrafo precedente ho parlato di Deepcrawl, ovvero della scansione in profondità di un sito web, solo che non ho detto a carico di quale data center avviene. Il fatto è che uno stesso sito web viene scansionato e asorbito in diversi data center, non soltanto in uno di essi, per motivi di sicurezza e accessibilità.

La verità sulla Google dance

La Google dance, vale a dire l’instabilità nel posizionamento dei risultati di ricerca tipica del primo mese dalla pubblicazione di un nuovo contenuto sull’internet, dipende spesso dal fatto che la query di ricerca è stata computata da un data center che non ha ancora allineato la valutazione della singola pagina sul deep crawling dell’intero sito web. Ecco come un risultato può apparire in terza posizione da Palermo per una certa chiave (non geolocalizzata) e in settima per la stessa query fatta da Milano: le due query potrebbero essere arrivate a due datacenter diversi non allineati sulla scansione complessiva del sito web.

Ringrazio Christian Zerjal per avermi spiegato questo processo che finalmente svela la verità su come funziona Google, almeno rispetto alla Google dance. Certo, esistono brevetti di Google che abbassano il ranking per i contenuti quando vengono riaperti troppo di frequente per modifiche forzate (specie sui link), esiste il famoso effetto sandbox per cui una pagina web viene retrocessa a tempo indeterminato per poi risalire in seguito, ma tutti i brevetti e tutte le leggi universali vere o presunte che siano, devono fare i conti con il deep crawling e l’archiviazione differenziata su più datacenter. Questa è la vera base del funzionamento hardware di Google.

Ecco come funziona Google.it

Ti sarai accorto che qui non parliamo di crawling, parsing, ranking e twerking, anche perché la guida di Enrico Altavilla fa già un ottimo lavoro in questo senso, né tantomeno io pretendo di conoscere gli aspetti tecnici del funzionamento dei motori di ricerca meglio di Enrico, che ritengo un luminare. Il mio approccio vuole integrare quello tecnico di “basso livello”, riflettendo sugli aspetti che pesanoindirettamente sul ranking, come il tempo di permanenza in pagina, la frequenza di rimbalzo, il numero di pageviews e tutti i dati tracciabili che possono risentire di un approccio ragionato sul perché oltre che sul come.

Noterai che in questo mio articolo ho usato spesso la parolaverità, che non è una parola chiave, ma appunto un termine correlato di quelli che purtroppo i software comeSemrush (sono il peggior brand ambassador della storia) non riescono ancora a darci, distribuendolo in modo più o meno regolare nel testo. Guarda, la scrivo ancora: verità. Oltre questo, ti sarai accorto che l’articolo presenta anche una co-citation di contenuti interessanti sul funzionamento di Google, ma non tutti posizionati per la chiave come funziona Google e allo stesso tempo sviluppa una menzione multipla di nomi rilevanti rispetto all’argomento.

Conclusioni e bibliografia

La SEO è fatta di struttura scansionabile, codice pulito e strategia di visibilità organica, ma anche di verità e di testi che sappiano catturare l’attenzione. Ricorda che non tutto ciò che è vero vince questa battaglia, ma ciò che è vero vince la guerra. Ti lascio una risorsa in inglese di Eric Schmidt e Jonathan Rosenberg, un libro intitolato how Google Works . Non c’entra niente con quest’articolo, ma vuoi mettere il riferimento bibliografico finale in inglese?

Non è che visto che sono “indiretti” spingono poco. È laforza dei segnali deboli.

  • Davide Taraborrelli

    Anche io mi occupo di SEO, ma devo dire che questo e uno dei migliori articoli che ho mai avuto il piacere di leggere. Esposto in maniera chiara e precisa, completo e ricco di informazioni. Davvero bravo, Francesco, dobbiamo tutti prendere esempio da te! 🙂