Una raccolta di documenti che sembrano descrivere come Google classifica il search ranking è apparsa online, probabilmente a causa di una pubblicazione accidentale da parte di un bot interno. Il leak descrive una vecchia versione dell’API Content Warehouse di Google e offre uno sguardo al funzionamento interno di Google Search.

Il materiale sembra essere stato commissionato inavvertitamente in un repository pubblico di Google su GitHub intorno al 13 marzo dall’automazione stessa di Google, che ha aggiunto una licenza open source Apache 2.0.

I documenti non contengono codice, ma descrivono come utilizzare l’API Content Warehouse di Google, probabilmente destinata solo all’uso interno. Includono inoltre più di 14.000 attributi accessibili o associati all’API, sebbene con poche informazioni sul loro utilizzo e importanza nell’algoritmo di ranking di Google.

google ranking

Tuttavia, i consulenti SEO ritengono che i documenti contengano dettagli degni di nota perché contraddicono alcune dichiarazioni pubbliche di Google. Ad esempio, verrebbero contraddette le negazioni di Google sull’utilizzo di segnali legati ai clic, l’esistenza di un “sandbox” per siti web più recenti e l’utilizzo dell’età di un dominio.

I documenti rivelano inoltre che Google memorizza un punteggio per determinare se un sito è autorevole, contraddicendo le affermazioni della stessa azienda di non avere un tale punteggio.

Altre rivelazioni riguardano l’importanza dei clic, l’utilizzo delle visualizzazioni di Chrome come segnale di qualità e l’uso di fattori come la freschezza dei contenuti, l’autorialità, la focalizzazione del sito e persino la dimensione media dei caratteri.