Rankbrain e la SEO dei Concetti

by francesco 635 views0

rankbrain
rankbrain

Ultimamente si fa un bel parlare di Rankbrain, un sistema di apprendimento automatico basato su intelligenza artificiale, trattato come il terzo più importante fattore di ranking. Ecco la mia lettura.

Le rivoluzioni hanno date convenzionali che nascondono lunghi processi di maturazione le cui dinamiche striscianti sono spesso difficili da leggere. Sotto il profilo della comunicazione non c’è niente di più efficace che dare un nome alle cose, tale che si pensi quella cosa esista solo da un certo momento in avanti. 

 

Rankbrain, appena nato?

Il “bambino” ha almeno due anni, perché pare essere parte integrante di hummingbird, l’algoritmo che ha come obbiettivo far rankare meglio i contenuti più vicini alle intenzioni di ricerca degli utenti indipendentemente dal fatto che siano ottimizzati o contengano la query esatta inserita da questi su Google. Semplicemente ora se ne comincia a parlare, ma è sempre stato là, in mano agli sviluppatori, diventando via via più importante.

È la parte di Google che apprende.

Proprio un paio di anni fa cominciai una fase di sperimentazione che mi portò a sviluppare la pratica dell’espansione del campo semantico di rilevanza a partire dallo studio dei vecchi algoritmi LSA ed LSI. Fu uno stillicidio. Alcuni tra i migliori SEO si scagliarono con tutto il loro peso contro di me e alcuni (non scherzo) ad oggi non mi rivolgono la parola.

Teorizzo (e dimostro) come Google sia in grado di stabilire relazioni tra parole chiave ed entità “concetti” i cui significati sono espressi in più documenti web pertinenti con la mia pagina obiettivo.

Se Google conosce il significato del concetto che utilizzo, se compongo il documento che lo sviluppa meglio di tutti e se infine questo concetto può essere associato a tutte (o quasi) le discussioni pertinenti con la mia chiave d’interesse, allora produrrò l’espansione del campo semantico di rilevanza per quella parola chiave, vale a dire che Google considererà il nuovo concetto come un’entità correlata.

Quando ho avviato la fase di sperimentazione, avevo bisogno di entrare fisicamente su blog e forum e far co-occorrere nelle discussioni il concetto “latente” e la parola chiave, ma via via che questo nuovo algoritmo si affina, ho sempre meno bisogno di farlo, perché Google riesce a cogliere i significati espressi in giro e decidere se possono essere ascrivibili ad un concetto latente, quindi proprio non espresso. Sto raggiungendo buoni risultati in questo senso distribuendo dicotomie nei testi, cioè coppie di termini di segno opposto che individuano il problema e la soluzione del problema, rendendo di fatto i documenti più rilevanti rispetto alle intenzioni (e alle query) degli utenti. 

 

Due critiche formali al mio approccio

Fondamentalmente le critiche sono due, la prima è che in effetti Google non è così evoluto da interpretare il significato delle singole frasi, la seconda è che il motore di ricerca deve computare 3 miliardi di ricerche al giorno, di cui circa il 15% sono query mai fatte prima. Per quante risorse abbiano a disposizione, non può funzionare come dico io, ergo, la semantica applicata ai motori di ricerca riguarda solo i dati strutturati, cioè le entità che Google riconosce per via di markup che ne favoriscono la comprensione.

 

Due risposte sostanziali alle critiche

Alla prima critica rispondo dicendo che non ho mai pensato a Google come ad un motore di ricerca che funziona su base interpretativa, ma associativa. È proprio associando i termini (e lo stemming di questi) presenti in uno o più documenti web, che Google riesce a comprendere gli argomenti che trattano. Più Hummingbird si sviluppa, più sfumature si riescono a cogliere associando parole, e più precisa sarà l’attribuzione di ranking. Via via che avviene questo processo, l’importanza degli altri segnali diminuirà in senso relativo. Questione di tempo.

Alla seconda critica formale, rispondo innanzitutto dicendo che tali cambiamenti non riguardano tutti i 3 miliardi di query, ma solo una parte di esse, quelle legate a oggetti di conoscenza intorno ai quali esiste un buon livello di conversazione online e condivisione di esperienze. È vero che Google non può avere le risorse per muovere vettori intelligenti su tutte le query del mondo, ma su molte di quelle che riguardano la salute, il matrimonio, iviaggi, le assicurazioni e il lavoro lo sta già facendo, perché ne vale la pena e se lo può permettere… ho le prove.

 

Conclusioni

Quando due esperti dicono due cose opposte, non è detto che uno abbia ragione e l’altro torto. Occorrerebbe che nella nostra comunità ci fosse una maggiore capacità di capire che ci sono eventi verificabili solo a certe condizioni, non sempre. È per questo che sostengo sempre con forza la quasi totale impossibilità di produrre una teoria (e una pratica) generale del posizionamento organico. Frasi come “tutti sanno che il posizionamento si ottiene solo con i link”, trattano Google come se fosse una persona che non mangia da 3 giorni, alla quale viene messo avanti un piatto di spaghetti al pomodoro.

Google è certo affamato, ma di buone intenzioni…