Cos’è un’entità

by francesco 192 views0

Un’entità è un oggetto di conoscenza riconosciuto come tale da Google. L’ingresso di un nuovo oggetto di conoscenza nel knowledge graph di Google, può essere facilitato dalla corretta organizzazione delle informazioni nelle pagine web secondo codifica in dati strutturati. La marcatura semantica serve dunque ad aumentare la corrispondenza tra uno o più oggetti “things” e le pagine web che li presentano agli utenti, contribuendo alla corretta sistematizzazione di tutte le informazioni all’interno di un web fatto di dati, appunto il web semantico.

Il Knowledge Graph o grafo della conoscenza è una funzione di ricerca introdotta da Google nel 2012. Si tratta del box che spesso capita di vedere sul lato destro della pagina di risposta di Google. Se ad esempio cerchi “Sergio Mattarella” su Google, vedrai comparire il nome, la carica istituzionale, una fotografia e un breve testo introduttivo preso da Wikipedia. A seguire troverai informazioni ulteriori con link di approfondimento verso informazioni personali come la coniuge, il mandato politico, i figli e altri congiunti. Ancora più in basso troverai una sezione con le foto più piccole di altri personaggi politici contemporanei direttamente collegati a Sergio Mattarella. Io la chiamo sezione “beautiful”, perché mette in relazione l’entità di partenza con gli altri protagonisti della storia per cui il personaggio stesso è degno di interesse.

Marcatori semantici

Quella che ti ho appena descritto è la modalità di ricerca relazionale, propria del web semantico. A grandi linee il lavoro di Google in questo caso è organizzare la conoscenza per nodi applicando etichette a ciascun oggetto. A grandi linee è come riordinare i calzini: nel primo cassetto ci sono quelli di lana organizzati per colore, nel secondo quelli di cotone lunghi e corti, nel terzo i pedalini e le mutande. Ecco, Google utilizza delle etichette per distinguere i cassetti e capire come sono organizzati i calzini al loro interno, in questo modo potrà aiutarci a trovare meglio i calzini corti quando fa caldo. A grandi linee. 🙂

Ecco, qui viene il bello, perché le etichette puoi metterle tu, contribuendo in prima persona al riordinamento di questa massa ingarbugliata di calzini, spesso nemmeno troppo puliti. Con i dati strutturati puoi definire intanto il tipo di pagina del sito web (pagina? articolo? categoria? scheda prodotto?), ma soprattutto puoi definire i singoli elementi che la compongono (immagini, titolo, descrizione, prezzo, data di pubblicazione, identificativo, orari di apertura e tanto altro) a seconda del tipo di pagina. Queste etichette si chiamano Properties e ne trovi la sintassi e gli esempi sul sito web schema.org. Il formato raccomandato è sempre il JSON-LD. A partire da qui puoi definire come dato strutturato perfino la struttura di navigazione avendo cura di marcare le breadcrumb per ogni pagina.

Come creare un’entità

Se non sei il Presidente della Repubblica, puoi comunque – in quanto autore del tuo blog – ambire a entrare nel Knowledge Graph come entità riconosciuta da Google, semplicemente inquadrando una “casa” per la nuova entità, ad esempio la pagina CHI SONO del tuo sito web. Su questa avrai cura di marcare la property author con il tuo nome e cognome (person). Il passaggio successivo è linkare da questa pagina tutte le altre pagine web esterne che parlano di te, come i profili social ed eventuali pagine ontologia su siti web come Wikipedia, Wikimedia, Wikidata o DbPedia. Questi link verranno marcati a livello dei dati strutturati con la property sameAs.

Infine dovrai aver cura di far puntare backlink dalle pagine di cui sopra verso la “casa” della tua entità. Questi passaggi possono favorire l’ingresso dell’oggetto di conoscenza “nome cognome” nel knowledge graph, ma lasciami dire, se il tuo blog parla in modo circostanziato di un argomento preciso ed ha una corretta marcatura semantica (a magari anche qualche visita), è molto meglio.

Cos’è una pagina ontologia

Ad ogni modo, spesso un oggetto di conoscenza diventa entità, dunque entra nel knowledge graph perché viene menzionato in una pagina ontologia, vale a dire una pagina che contiene informazioni fatte apposta per essere inserite nel sistema nodale del knowledge graph. I siti web che menzionavo prima sono dunque i più importanti depositari della conoscenza sul web. Quando fai qualcosa di molto fiko, come scrivere un libro, vincere una grossa competizione sportiva, girare un film, creare un brand famoso o diventare presidente della repubblica, il tuo nome finisce in almeno una di queste pagine, messo in relazione con altre entità.

Guarda ad esempio la pagina dedicata alla SEO su DBpedia. Non ci si capisce niente, vero? In effetti le pagine ontologia non sono immediate da leggere per gli esseri umani, tuttavia sono davvero importanti per Google, per i motivi che ti ho descritto prima.

Semantica associativa (non strutturata)

Ma sarebbe riduttivo pensare che un’entità sia solo ciò che entra nel knowledge graph, perché in realtà Google conosce molte più cose di quante non ne vengano descritte nella funzione di ricerca a nodi che visualizziamo cercando personaggi famosi su Google. Ad esempio, Google serve un knowledge graph per il termine “ulcera”, ma non per “mal di testa”, o “emicrania” o “cefalea” pur capendo benissimo di cosa si tratti. Da qui possiamo allargare il campo e desumere che qualunque termine in pagina possa essere considerato un’entità nella misura in cui Google ne abbia contezza per lo meno in riferimento a un contesto preciso.

A grandi linee Google capisce che “calcio” assume un significato se parliamo di chimica e un altro se discutiamo di sport, dunque in base al tipo di sito web sotto scansione, potrà valutare il singolo termine. È la semantica non strutturata di cui scrivo ampiamente nel Manuale di Seo Gardening, quella che ci permette di fare analisi semantica latente per individuare concetti nuovi da “infilare” tra quelli già noti al motore di ricerca, con la finalità di creare nuove entità associate a quelle già ritenute rilevanti. Gli esperimenti condotti in questo senso – molti dei quali non mi è possibile divulgare – mi fanno letteralmente brillare gli occhi, fosse solo per la sensazione, pur a distanza di anni, di aver appena intravisto la vera intelligenza del motore di ricerca, quella che va al di là dei fattori di ranking che definiscono la qualità eseguendo calcoli ponderati.

È come osservare un bambino che usa il linguaggio per imparare a pensare.