9 febbraio 2010 Andrea Bernardi

Contenuti duplicati: come trattarli

Informare descrivendo in modo dettagliato ed accattivante i propri servizi e prodotti è essenziale per ogni azienda o attività, online ed offline.

Partiamo da un esempio della vita quotidiana: un negoziante che vuole migliorare l’aspetto comunicativo nel presentare a voce un prodotto, cerca di usare frasi e descrizioni ogni volta differenti, per evitare di ripetersi e di annoiare eventuali clienti in fila che stavano ascoltando e che, arrivato il loro turno, si sentono ripetere le stesse identiche parole.

Questa logica, applicata ai siti web, viene seguita da Google nel valutare le finalità di un testo che risulta duplicato in più pagine, prestando anche attenzione agli aspetti tecnici di programmazione che possono aver causato tale ripetizione.

Google afferma che “…se il tuo sito contiene una versione “regolare” e una “stampabile” di ciascun articolo e nessuna di esse è bloccata in robots.txt o con un metatag noindex, ne sceglieremo una sola.” Questo equivale ad affermare che si lascia la libertà di decisione al motore, anziché istruirlo e guidarlo verso le pagine che vogliamo far comparire in seguito ad una ricerca.

Alcuni casi esemplificativi di duplicazioni involontarie:

•    forum di discussione che creano pagine regolari e pagine destinate al mobile
•    news archiviate
•    versioni stampabili delle pagine.

 

Nel caso in cui un sito web si ritrovasse ad avere contenuti duplicati, innanzitutto non c’è da allarmarsi, ma è bene agire in modo corretto per ottenere pagine uniche da presentare al motore e al visitatore.

Cosa fare per risolvere il problema dei contenuti duplicati

1.    indicare l’URL preferito a Google (canonicalizzazione): se il sito propone più pagine con contenuti molto simili tra loro o identici, oppure offre gli stessi testi tramite URL diversi, Google consiglia di indicare un URL canonico, ed esprimere così la preferenza.
Si può indicare questo URL inserendo un <link rel=”canonical” href=”http://www.example.com/cartella/paginapreferita.html”> all’interno della sezione <head> </head> delle pagine non canoniche.

2.    bloccare le pagine che non interessano tramite robots.txt: un file che viene sempre letto dagli spider dei motori, contenente istruzioni sulle pagine alle quali possono o non possono accedere

3.    utilizzare il redirect 301:  comando che permette di far atterrare utenti e spider da una vecchia pagina (non più utilizzata o doppia), verso quella nuova e definitiva

4.    essere coerente: fare in modo di uniformare la composizione dei link interni. Ogni singola pagina deve essere raggiunta tramite un unico indirizzo
Es.: http://www.dominio.ext/pagina/
non deve essere http://www.dominio.ext/pagina e neppure http://www.dominio.ext/pagina/index.htm

5.    verificare i testi che pubblicate su altri siti: l’inserimento delle descrizioni dei servizi e prodotti o i testi di presentazione del sito devono differire da quelle originarie, se decidete di diffonderle su portali o siti esterni.
Inoltre assicuratevi che ci sia un link che rimanda alla pagina o articolo originale

6.    utilizzare lo strumento per webmaster di Google (Webmaster Tools): comunica al motore il dominio preferito: www.dominio.ext oppure http://dominio.ext

7.    ridurre il più possibile la ripetizione di parti fisse: spesso capita che i CMS ripetano in tutte le pagine parti fisse contenenti del testo sempre uguale. Create pagine dedicate alle quali accedere con un link: ad esempio,  una pagina col testo della Privacy, o delle condizioni di contratto.
Yahoo! permette di marcare come non appartenenti al corpo del testo principale elementi grafici fissi tramite l’attributo “robots-nocontent”

8.    conoscere a fondo il proprio sistema di gestione dei contenuti: sapere come vengono gestite le pagine e ogni loro elemento da parte del CMS vi aiuterà ad evitare la creazione involontaria di più pagine con lo stesso testo

9.    limitare il più possibile contenuti simili: se diverse pagine parlano di uno stesso argomento, è meglio cercare di raggrupparle in un’unica pagina.

 

Infine, è bene sapere che non vengono ritenuti contenuti duplicati gli stessi testi se tradotti in lingua straniera.