Che cos'è la canonicalizzazione?

La parola canonica significa qualcosa che è conforme a uno standard accettato. La canonicalizzazione - o canonicalizzazione in inglese britannico - è il processo mediante il quale qualcosa viene reso conforme allo standard accettato. Nel regno dei computer, il termine canonicalizzazione è usato per indicare il rispetto degli standard in diverse aree. È spesso considerato il problema, quando in realtà è la soluzione a una varietà di problemi. Dal momento che è una parola così lunga, la canonicalizzazione è abbreviata usando la sua prima e l'ultima lettera e il numero di lettere tra: c14n.

La canonicalizzazione viene utilizzata nell'IT (Information Technology) in diverse impostazioni. Si riferisce agli indirizzi dei mittenti di posta elettronica, alla costruzione del nome file, alla codifica di stringhe in Unicode, all'uso di XML (EXtensible Markup Language) e alla costruzione di URL (Uniform Resource Locator). In ogni caso, il problema è la capacità di più formati che rappresentano lo stesso oggetto, con la canonicalizzazione come via per coerenza e standardizzazione.

Prendi XML come esempio. XML consente modifiche sintattiche. Ciò significa che due documenti non identici potrebbero avere la stessa forma canonica e quindi essere funzionalmente equivalenti. La specifica XML canonica è stata progettata per risolvere questo problema stabilendo un metodo mediante il quale è possibile stabilire l'identità di documenti separati. Il metodo per generare la forma canonica per ogni dato documento XML è chiamato metodo di canonicalizzazione XML .

Per la canonicalizzazione degli URL, l'idea è di fare riferimento a una pagina Web specifica in modo coerente con un URL. L'esempio più semplice sono due versioni di una home page, una delle quali ha le tre w e l'altra no:

http://www.wisegeek.com

contro

http://wisegeek.com

Questo è un problema per la SEO (Search Engine Optimization) perché divide i rapporti per il traffico, tutti effettivamente diretti nello stesso posto. Il risultato è che il sito con più URL per le stesse pagine sembra avere prestazioni più scarse di quanto non sia in realtà.

Ci sono altri problemi oltre a quelli di w . Questi includono barre finali e differenze tra le versioni degli URL con lettere maiuscole e minuscole. Matt Cutts di Google® consiglia di affrontarlo utilizzando un reindirizzamento permanente (301) di tutti gli URL alternativi all'URL desiderato, consentendo ai motori di ricerca di giudicare quale sia l'URL canonico.

ALTRE LINGUE

Questo articolo è stato utile? Grazie per il feedback Grazie per il feedback

Come possiamo aiutare? Come possiamo aiutare?