Struttura di linking e sitemap

Immagine struttura di linking interno.
Image credits: jscreationzs

Nella sezione della guida dedicata all’architettura informativa abbiamo sottolineato l’importanza che i link all’interno delle pagine del sito web rivestono ai fini di una corretta indicizzazione sui motori. E’ proprio grazie ai link in formato HTML, infatti, che gli spider dei motori di ricerca riescono a perlustrare e raggiungere tutte le pagine del nostro sito, per poi leggerne, interpretarne e indicizzarne i contenuti.

I benefici legati alla predisposizione di una corretta struttura di linking interno non si fermano però qui.  Attraverso un uso strategico degli anchor text dei link presenti all’interno del nostro sito, infatti, possiamo favorire la tematizzazione delle pagine e migliorarne il posizionamento sui motori per le parole chiave di riferimento.

Ruolo dell’anchor text

Un link è composto da diverse parti. Le più importanti sono l’anchor text e la pagina di destinazione del link. L’anchor text del link è la parte di testo visibile e cliccabile del collegamento, la pagina di destinazione identifica la risorsa cui è possibile accedere dopo aver fatto click sul link.

Anchor text e pagina di destinazione di un link.

Immagine – Anchor text e pagina di destinazione di un link.

L’anchor text dei link che compongono la struttura di navigazione rappresenta un elemento al quale possiamo fare affidamento per migliorare la tematizzazione delle pagine del nostro sito, in aggiunta all’ottimizzazione dei fattori onsite sinora menzionati (Tag Title, Tag Heading, contenuti testuali, ecc.)

L’anchor text di un link viene preso in considerazione dall’algoritmo dei motori di ricerca per identificare il tema della pagina linkata e ne agevola il posizionamento tra i risultati naturali per le parole chiave in esso contenute.

A titolo esemplificativo, se vogliamo ottimizzare una pagina del nostro sito per la keyword “antifurto auto”, è preferibile che essa sia raggiunta da link aventi come anchor text “antifurto auto” meglio se con un link di tipo sitewide (come quelli presenti nel menu di navigazione).

Dell’importanza dell’anchor text dovremo tener conto soprattutto in fase di definizione del menu di navigazione principale del sito, al quale spetterà il compito di illustrare allo spider dei motori di ricerca il contenuto delle principali sezioni del sito.

Va infine considerato che in presenza di immagini-link è l’attributo ALT dell’immagine ad assolvere al ruolo di anchor text nella tematizzazione della pagina linkata (sia pur con un’efficacia minore), attributo che sarà quindi necessario compilare opportunamente utilizzando, laddove possibile, le parole chiave per le quali si desidera ottimizzare la pagina di destinazione.

Sitemap HTML

Per agevolare gli spider dei motori nel loro compito di perlustrare e indicizzare le pagine del sito e per consentire agli utenti un più agevole reperimento delle risorse di interesse è fortemente consigliabile l’implementazione di una sitemap HTML, opportunamente linkata da tutte le pagine del sito.

La sitemap HTML è una pagina web che consiste in un semplice elenco di link a tutte le pagine del sito (o alle più importanti, nel caso di siti con centinaia/migliaia di pagine), eventualmente accompagnati da una breve descrizione che introduce la sezione di riferimento. Per rendere più usabile la sitemap, la disposizione visiva dei link ricalca spesso una “struttura ad albero”.

La sitemap HTML è uno strumento utile nell’ambito di un progetto di ottimizzazione, perché permette agli spider dei motori di ricerca di accedere in modo più rapido ed efficace alle sezioni di cui si compone il nostro sito, agevolandone così il processo di indicizzazione.

La sitemap HTML può inoltre contribuire ad un miglioramento nella tematizzazione delle pagine da essa linkate (attraverso un uso strategico degli anchor text utilizzati per i collegamenti alle varie sezioni), con benefici effetti sul fronte del posizionamento tra i risultati naturali dei motori di ricerca.

Sitemap XML

Per permettere agli spider dei motori di ricerca una perlustrazione delle pagine del sito ancora più efficiente (soprattutto in presenza di siti di grandi dimensioni e composti da un elevato numero di pagine), può essere conveniente affiancare alla sitemap HTML una sitemap in formato XML.

La sitemap XML è un file contenente l’elenco di tutti i link alle pagine di un sito web, in un formato accessibile ai motori di ricerca. La sintassi di base di una sitemap XML è la seguente:

Sitemap XML esempio.

La prima riga è l’intestazione del file XML (serve per dichiarare che stiamo utilizzando il linguaggio XML), mentre il tag <urlset> viene aperto per definire il protocollo della sitemap XML. Per ciascuno degli URL da sottoporre al motore di ricerca dovremo aprire il tag <url> e definire l’indirizzo della pagina con il tag <loc> (obbligatorio).

Il file deve essere salvato con codifica UTF-8 e posto nella root del sito. Per il nome del file, è preferibile optare per il generico sitemap.xml (anche se non è obbligatorio).

Per notificare ai motori di ricerca l’esistenza della sitemap XML è possibile effettuare una segnalazione manuale attraverso l’apposita sezione di Google Webmaster Tools, oppure includere all’interno del file robots.txt la seguente istruzione (avendo naturalmente cura di sostituire le voci “nomedidominio.com” e “sitemap.xml” con il reale nome di dominio e della sitemap XML):

Sitemap: http://www.nomedidominio.com/sitemap.xml

La creazione della sitemap XML può essere delegata a tool online e software appositamente adibiti a questo compito. Ve ne sono molti in rete, disponibili gratuitamente, che generano la sitemap XML del sito a partire dal nome di dominio e dalle istruzioni fornite in fase iniziale dall’utilizzatore del servizio. Tra gli strumenti online si segnala Xml-sitemaps.com, tra i migliori tool per la generazione di sitemap XML, benché nella sua versione gratuita non permetta l’inclusione di più di 500 URL all’interno della sitemap. Tra gli strumenti software consigliamo l’uso di GSiteCrawler, anch’esso disponibile gratuitamente.

Per approfondimenti sulle sitemap XML consigliamo la consultazione di Sitemaps.org, il sito frutto della collaborazione congiunta dei tre grandi motori di ricerca per supportare l’implementazione e l’utilizzo del protocollo sitemaps.

Struttura di linking e outbound link

Concludiamo il discorso relativo alla struttura di linking del sito facendo alcune riflessioni sugli outbound link (link in uscita), ovvero i collegamenti presenti nel sito che puntano a pagine e risorse esterne.

Gli outbound link contenuti nelle pagine del nostro sito dovrebbero preferibilmente puntare a risorse che trattano temi simili o attinenti.

La presenza di un consistente numero di collegamenti diretti a risorse che non hanno nulla a che fare con gli argomenti trattati all’interno del nostro sito (specie se localizzati in sezioni specifiche della pagina, quali footer, sidebar, ecc.) può costituire un campanello d’allarme per i motori di ricerca, che possono persino arrivare ad ipotizzare un coinvolgimento del sito in attività di vendita link (con le penalizzazioni che ne conseguono).

Un’altra raccomandazione importante è quella di evitare a tutti i costi link diretti a siti bannati o a pagine percepite dal motore di ricerca come “spam”: la presenza di collegamenti alle suddette risorse può infatti comportare serie penalizzazioni a carico del sito che offre il link, che possono addirittura arrivare all’esclusione dello stesso dai risultati di ricerca.

A quest’ultimo aspetto devono dedicare particolare attenzione soprattutto gli amministratori di siti che fanno ricorso a contenuto generato dagli utenti (UGC, User Generated Content) e che permettono ai propri visitatori di inserire link diretti a siti esterni in maniera automatica (blog, forum, ecc.) Se non è possibile procedere ad una moderazione preventiva da parte del webmaster, finalizzata ad eliminare i collegamenti alle risorse potenzialmente problematiche, la soluzione migliore è quella di fare in modo che i link associati agli interventi degli utenti abbiano tutti l’attributo rel=”nofollow”. L’attributo rel=”nofollow” in corrispondenza di un link permette al webmaster di inviare al motore di ricerca l’istruzione “non seguire questo link” e di evitare che il collegamento sia interpretato come un “voto a favore” della risorsa linkata, scongiurando il rischio di penalizzazioni derivante dalla presenza di link a risorse ritenute “spam” dal motore.