Domande sulla Semantica

by francesco 1.2K views0

Nell’articolo di oggi ho il piacere di “provare” a rispondere ad alcune domande sulla semantica che arrivano da un SEO francese di nome Walid Gabteni di cui presto sentire parlare.

domande sulla semantica
domande sulla semantica

Walid mi ha scritto in privato facendomi una delle più belle recensioni che ho mai letto sul Manuale di Seo Gardening. Nella stessa email, il mio nuovo amico mi pone alcune questioni emerse dalla lettura del libro. Il bello di tenere un blog è che puoi usarlo per lasciare una traccia pubblica delle risposte a domande del genere, in modo che siano sempre fruibili da tutti. Detto questo partiamo con le domande.

Come vengono indicizzate le pagine rispetto alle varie query correllate?

Il processo di indicizzazione è chiaramente il medesimo per ogni documento web la cui scansione non sia inibita mediante file robots.txt. Google suddivide i documenti per classi di significati, ad esempio, per la query “case in legno usate”, Google restituisce inizialmente documenti rilevanti con tale query e via via con le ricerche correlate che trovi in fondo alla stessa serp. Esistono però parole chiave sempre correlate, ma che appartengono ad una classe diversa, come ad esempio “gazebi in legno” o ancora “tettoie in legno”, che non compaiono immediatamente tra le correlate, ma vanno cercate con lo “sguardo” di un SEO, scrutando cioè attraverso le serp. È a partire da qui che puoi cominciare a ragionare sul topic N, ma devi stare attento a non cercare le correlazioni in modo troppo superficiale, né troppo approfondito. È sufficiente che ti sposti un po’… di lato. Suggerimento, i software funzionano solo fino a un certo punto. Vedi. 😉

Come Google mette “in stock” le co-occorrenze? Come fa Google a decidere se su tale pagina una co-occorrenza è valida oppure no? 

Le co-occorrenze testuali sono importantissime per due motivi, il primo è che consentono a Google di determinare in quali classi di significati ci stiamo muovendo, il secondo è che sono cruciali per determinare il valore dello stesso documento web. Se ad esempio faccio co-occorrere in un testo la parola espresso alle parole binario, ferrovia, stazione, freccia rossa e Italo, Google capirà che parliamo di “treni”. Prende questa decisione sulla base di tutte le ontologie in suo possesso. Fin qui però ci concentriamo su “chi scrive”, mentre se ci spostiamo su “chi cerca”, troveremo che in base alle notizie di maggior interesse, spesso veicolate degli organi di informazione, Google è pronto ad attribuire maggior valore al documento che fa co-occorrere le parole che da un lato determinano il significato e dall’altro rispondono ad una domanda precisa (e interessante per molti) su quel significato. Se quindi in un certo momento tutti i treni cominciano ad arrivare in ritardo per una serie di proteste sui binari, non sarà una cattiva idea sviluppare l’ontologia di “treno” insieme a quelle di “ritardo” e “protesta”. Google capisce prima di cosa parliamo e poi tenta di capire quanto siamo rilevanti rispetto alle ricerche correlate più frequenti.

A che livello della ricerca Google usa la LSA? nel sistema d’indicizzazione, per determinare il ranking o in entrambi i casi?

Max Wilson parla di modelli probabilistici e di LSA mentre spiega come funzionano i motori di ricerca. L’analisi semantica latente (LSA) è un’analisi testuale il cui obiettivo è individuare una variabile non visibile, appunto latente, a partire da una serie di corrispondenze rilevate nei documenti web che hanno caratteristiche specifiche rispetto a una parola chiave d’interesse. In pratica Google si accorge che a volte le persone tendono a rappresentarsi un problema conoscitivo girando sempre intorno agli stessi significati. Quando Google trova questo genere di corrispondenze si limita a prenderne atto. Da quel momento si crea l’equivalente di una “voce di popolo” o se preferisci un luogo comune. La bravura di un SEO che sviluppa un’analisi di questo tipo, è nel cogliere la rilevanza di tale rappresentazione sociale rispetto ad una keyword d’interesse e imbrigliarla all’interno di un singolo concetto (la variabile non visibile di cui sopra) che una volta esplicitato e messo in relazione alla keyword obiettivo faccia convergere l’attenzione di Google su di esso. Si pensava che l’analisi semantica latente avesse a che fare solo con il modo in cui Google comprende e classifica, ma nel libro spiego come la LSA sia un dispositivo di cui Google può tener conto (e spiego come) anche per determinare il ranking di un documento web.

Come fa Google ad attribuire un valore ai significati?

Sulla base di quali sono più utili. In realtà nel libro ne parlo già abbastanza approfonditamente. Il significato utile è quello più ricercato e meno trattato, oppure quello che oltre a rispondere alla domanda esplicita sviluppa anche quella latente, spesso spostando l’attenzione dal come al perché. In ogni caso parliamo di come creare valore in modo qualitativamente superiore e più rispondente alle esigenze degli utenti. Si tratta di capire cos’altro interessa tantissimo alle stesse persone che effettuano una ricerca per una keyword di tuo interesse.

Potresti spiegare meglio il rapporto tra numero di pagine che contengono un significato e volume di ricerca dello stesso significato?

In effetti nel libro mi riferisco al rapporto tra numero di documenti indicizzati che sviluppano un dato topic e numero di persone che ogni mese cercano proprio quel topic. È indubbio che se il tuo articolo sviluppa un argomento molto ricercato e poco trattato, tenderà ad essere premiato da Google sulla base del fatto che è più utile rispetto ad altri documenti che parlano della stessa cosa senza però sviluppare quell’argomento preciso.

Conclusioni

Mi fa sempre molto piacere rispondere alle domande che mi fate (in tanti), per cui invito tutti a continuare a scrivermi, magari attraverso questo blog. Grazie ancora a Walid per la belle parole spese in privato e buona lettura a tutti quelli che sceglieranno il Manuale di Seo Gardening.