Posizionamento nei Motori di Ricerca

INFO: TEL. 02/26.82.28.75 INTERNO 251

OLTRE IL PAGERANK: TECNICHE DI RANKING SUI MOTORI DI RICERCA

Saremmo degli ingenui a pensare che tutta la forza di Google si basi solo sul PageRank ( o Page Rank) , e che d'altra parte questo si riduca solo ad una tutto sommato semplice formula matematica ( facilmente imitabile ).

Pur essendo questo il cuore del suo algoritmo di ricerca ( e dunque uno dei motivi del suo successo ), il PageRank è solo uno dei tanti, tantissimi parametri presi in considerazione da Google per decidere la posizione di una pagina.

Per tale ragione un valore di PageRank alto non garantisce necessariamente una posizione migliore rispetto ad una pagina con PageRank più basso.

Capita spesso infatti che pagine con PageRank basso superino in posizione le pagine con un PageRank più alto ma con contenuti ( testi, tag HTML, link, ecc. ) meno ottimizzati: è opinione diffusa infatti che il PageRank sia calcolato con un metodo simile a quello visto, ma che venga poi corretto ( in alto o in basso ) in base ad alcuni particolari criteri.

Per questa ragione è sconsigliato interessarsi al PageRank delle pagine del proprio sito come se fosse l'unico mezzo per ottenere buoni risultati. Al contrario, si tratta di un elemento che acquisisce importanza solo se è accompagnato dalla presenza di altre caratteristiche essenziali, a cominciare dai contenuti e dal grado di ottimizzazione delle pagine.

DINAMISMO DELLE PAGINE

Abbiamo già avuto modo di capire che esistono in Internet pagine "statiche" ( scritte dai webmaster ) e pagine "dinamiche" ( scritte dai visitatori ).

Solitamente ( ma non sempre ) quelle di tipo statico hanno estensione "htm" o "html" ( poiché il codice usato è appunto l'html ) mentre quelle dinamiche hanno estensione "php" o "asp" ( estensione derivata dai rispettivi linguaggi ).

Google in questo momento, a parità di PR , sembra preferire ( o comunque dare più peso assoluto ) alle pagine di tipo html o htm, forse per il principio generale che ciò che scrive un webmaster dovrebbe essere ( ma spesso è esattamente l'opposto ) più importante di ciò che scrive un utente normale.

Questa tendenza a preferire l'html però sembra si stia riducendo col tempo poiché i linguaggi dinamici stanno diventando pian piano lo standard su Internet ( per la loro natura che è appunto dinamica e quindi più funzionale e perché permettono l'uso di un database ).

Possiamo dunque con ragionevolezza prevedere che nel breve periodo il diverso peso assoluto dato ai vari linguaggi di scrittura di un sito non solo tenderà a ridursi, ma probabilmente vedrà una inversione di tendenza.

Anche la frequenza del rinnovo dei contenuti ( modificazioni del testo e dei link ) di un sito sembrano avere una certa influenza non solo sui tempi di indicizzazione e di refresh ma anche sulla posizione di un sito in classifica.

In particolare più spesso viene aggiornato un sito e più Google lo visiterà di frequente e gli assegnerà un'importanza maggiore di un altro sempre uguale a se stesso: i Googlebot sono infatti in grado di percepire questo elemento.

La logica che sta dietro questo comportamento assai usuale è molto facile da capire: in presenza di siti con PR simile, si vuol dare più risalto ai contenuti più nuovi ed aggiornati. La frequenza di aggiornamento infatti ( entro certi limiti ) potrebbe essere addirittura elemento che scavalca il PR stesso.

Si capisce dunque come pagine sempre nuove in contenuti siano altamente Google Friendly, molto considerate e molto spesso aggiornate in indicizzazione.

Se il rinnovo del testo ha un' altissima importanza, ancora di più ne ha il rinnovo dei link di un sito ed in particolare di quelli testuali: i link ( soprattutto quelli interni ovviamente ) sono sempre considerati da Google parte più importante del testo poiché sono nella maggior parte dei casi "porte" verso altri argomenti più specifici e quindi delle specie di titoli di pagine a cui essi rimandano.

Possiamo considerare due tipi di link possibili: quelli " testuali" e quelli " ad immagine ". Questi ultimi sono delle specie di banner che in realtà non contengono pubblicità ma sono veri e propri link interni come ad esempio la presenza di un pulsante "entra".

Google distingue questi due tipi di link ed assegna loro un'importanza diversa.

In particolare i link testuali sono considerati decisamente più importanti di quelli "ad immagine" .

I link "ad immagine" sono nella maggior parte dei casi associati a fotografie ( come anteprima ), ad azioni elementari ( come appunto il pulsante "entra" ) o a banner, mentre quelli testuali sono più facilmente riconducibili alla mera consultazione del sito web e sono loro gli accessi veri e propri per lo spidering del sito, senza contare che vengono naturalmente più spesso aggiornati i secondi dei primi ( se viene fatto un link " ad immagine" di solito si tratta di qualcosa di statico e duraturo, anche perché in caso contrario andrebbe rifatta l'immagine ed è un lavoro assai più complesso dell'aggiornamento di un link testuale ).

I link testuali poi hanno due tipi di dinamicità possibile: il cambiamento dell'URL di destinazione del link ed il cambiamento del testo di descrizione del link stesso ( mentre i link "ad immagine" possono solo modificare il primo fattore, essendo le immagini totalmente ignorate già in fase di crawlerizzazione ).

Questo può sembrare un elemento banale ma in realtà è assolutamente cruciale; se infatti abbiamo visto come ad un link corrisponda un'assegnazione di PR, in questo caso abbiamo qualcosa di più: alla pagina di destinazione oltre al PR viene assegnato anche un "peso" al testo che descrive il link che porta ad essa.

Supponiamo di avere tre pagine: una pagina A, una pagina B ed una C.

La pagina A dà un link "ad immagine" alla pagina B ( che tratta, ad esempio, di problemi con Fastweb ).

La pagina A dà anche un secondo link, questa volta testuale, il cui testo è "problemi con Fastweb" alla pagina C ( anch'essa si occupa della tematica di B ).

A parità di PR di B e C ( e di altri fattori quali la key density, che analizzeremo in seguito ) la pagina C risulterà più in alto nella classifica in Google per la query di ricerca "Problemi con fastweb" rispetto alla pagina B proprio perché il link testuale ha permesso a Google di ricevere un'informazione in più su ciò di cui parla C.

E' evidente anche che sono state escluse parole molto comuni di testo come ad esempio "scarica", "download", "qui" o "here", tanto per citarne alcuni.

Possiamo anche spingerci oltre e stilare una classifica dei "pesi assoluti" che Google attribuisce ai vari link che possono essere fatti. Partiamo dal più importante e andiamo, scendendo, verso quello meno importante:

  1. Link testuali con testo dinamico ed URL di destinazione dinamica.
  2. Link testuali con testo fisso ed URL di destinazione dinamica.
  3. Link testuali con testo fisso e URL di destinazione fissa. (*)
  4. Link "ad immagine" con URL di destinazione dinamica ( rari ). (*)
  5. Link "ad immagine" con URL di destinazione fissa.

(*) Le posizioni 3 e 4 potrebbero essere invertite.

Da ciò possiamo trarre le seguenti conclusioni:

  • Il testo ( e quindi i contenuti ) di un sito ed i link devono essere aggiornati più spesso che si può.
  • E' decisamente meglio usare link testuali per pagine interne al nostro sito, ed è ancora meglio se il link testuale è il più dinamico possibile in entrambe le sue componenti: l'URL ed il testo di descrizione.
  • Il testo di descrizione di un link interno deve essere il più mirato possibile e rispondente all'argomento che si tratta nella pagina di destinazione del link stesso: deve essere preciso e, per quanto possibile, sintetico.
  • Per link esterni è indifferente l'uso di un tipo di link rispetto ad un altro in termini di nostra utilità. Chiaramente se vogliamo dare un apporto maggiore al sito esterno dovremo preferire i link testuali ( meglio se dinamici ).

 

E' evidente dunque che ancora una volta i siti totalmente dinamici, e cioè quelli "redatti" direttamente dagli utenti come i forum, possiedono un gran vantaggio ( oltre a quello già descritto dell'autocombustione ): hanno link testuali e questi sono continuamente aggiornati dagli stessi utenti che "postano" nuovi messaggi cambiando così i link ( sia il testo descrittivo che l'URL ) di una pagina indice anche diverse volte al minuto.

Google ha voluto ( non a torto ) tamponare questo fenomeno di vantaggio competitivo dei forum e newsgroup sugli altri siti poiché il rischio era quello di ottenere praticamente ad ogni ricerca una pagina di un forum come risultato in cima alla classifica ( cosa che comunque molto spesso accade tuttora ).

E' stato allora introdotto nell'algoritmo una sorta di stop word per le pagine munite di un ID utente, e cioè quelle usate praticamente da tutte le board disponibili ( come ad esempio la seguente: http://w ww.phpbb.com/phpBB/viewforum.php?f=1&sid=63aec191fa3fc0dd86051f1543236e6e, in cui la parte dell'indirizzo da "sid" è esattamente quella identificativa dell'utente ).

Analoga stop word è stata introdotta per alcune parole chiave nella URL come "viewtopic" o "viewforum", anch'esse tipiche delle board più diffuse come phpBB2 .

Questo filtro vale però al di sotto di un certo PR, oltrepassato il quale - vista l'importanza del sito - se non sparisce comunque si attenua e viene permessa la crawlerizzazione del sito tutto ( anche se il Ranking del medesimo sembra essere fortemente penalizzato ).

Esistono peraltro dei modi ( poco conosciuti, per la verità ) per eliminare l'ID utente e per cambiare le parole chiave di "stop" nell'URL.

 

 

indicizzazione sui motori di ricerca
INFO: TEL. 02/26.82.28.75 INTERNO 251
posizionamento sui motori di ricerca