Come Funzionano i Motori di Ricerca? Una Guida per Principianti

Avatar
Head of Content @ Ahrefs (o, in parole povere, sono la persona che fa sì che ogni articolo pubblicato sul nostro blog sia EPICO).
I motori di ricerca scansionano il web utilizzando dei bot che prendono il nome di spider. Questi seguono i link da una pagina all’altra, al fine di trovare nuovi contenuti e aggiungerli al loro indice. Quando utilizzi un motore di ricerca, i risultati più pertinenti vengono estratti dall’indice e posizionati utilizzando un algoritmo.

Se questo ti sembra complicato, è perché lo è. Ma se vuoi sapere come posizionarti in alto sui motori di ricerca per portare più traffico al tuo sito, devi comprendere la basi di come i motori di ricerca trovano, indicizzano e posizionano i contenuti.

Questo è proprio quello che imparerai in questa guida.

Chapters


    Prima di addentrarci nella parte tecnica, assicuriamoci di capire cosa sono i motori di ricerca, perché esistono e perché ha senso sapere queste cose.

    Cosa sono i motori di ricerca?

    I motori di ricerca sono degli strumenti che trovano e posizionano i contenuti presenti nel web in base a quello che viene chiesto dall’utente.

    Ogni motore di ricerca è costituito da due componenti principali:

    1. Indice di ricerca. Una libreria digitale di informazioni sulle pagine web.
    2. Algoritmo(i) di ricerca. Programmi che posizionano i risultati più pertinenti presi dall’indice di ricerca.

    Alcuni esempi di motori di ricerca conosciuti sono Google, Bing, and DuckDuckGo.

    Qual è lo scopo dei motori di ricerca?

    Ogni motore di ricerca prova a fornire il risultato migliore e più pertinente per l’utente. Questo è il modo in cui ottengono o trattengono la propria quota di mercato—almeno in teoria.

    Come guadagnano i motori di ricerca?

    I motori di ricerca hanno due tipologie di risultati:

    • Risultati organici presi dall’indice di ricerca. Non puoi pagare per apparire fra questi.
    • Risultati a pagamento dagli advertiser. Puoi invece pagare per apparire qui.

    Ogni volta che qualcuno fa click su di un risultato a pagamento, l’inserzionista paga il motore di ricerca. Questa si chiama pubblicità pay-per-click (PPC).

    Questo è il motivo per cui la quota di mercato conta. Più utenti significano potenzialmente più click e fatturato.

    Perché dovresti sapere come funzionano i motori di ricerca?

    Comprendere il modo in cui i motori di ricerca trovano, indicizzano e posizionano i risultati ti aiuterà a posizionare meglio il tuo sito fra i risultati di ricerca organici per parole chiave pertinenti e ricercate.

    Se riesci a posizionarti in alto per queste ricerche, otterrai più click e traffico organico verso i tuoi contenuti.

    Qual è il motore di ricerca più utilizzato?

    Google. Ha una quota di mercato del 92%.

    Google è il motore di ricerca del quale la maggior parte dei professionisti SEO e dei proprietari dei siti web si preoccupa, in quanto fra i motori di ricerca è quello che ha più potenziale di portare traffico.


    La maggior parte dei motori di ricerca più conosciuti come Google e Bing ha miliardi di pagine all’interno del proprio indice. Quindi prima di parlare degli algoritmi di posizionamento, approfondiamo la questione legata ai meccanismi utilizzati per creare e mantenere l’indice di ricerca.

    Ecco il processo base, per concessione di Google:

    Vediamo ogni singolo passaggio:

    1. URL
    2. Scansione
    3. Processazione & Rendering
    4. Indicizzazione
    Nota a margine.
    Il processo qui sotto è specifico a Google, ma probabilmente quello degli altri motori di ricerca, come ad esempio Bing, è molto simile. Esistono altre tipologie di motori di ricerca come Amazon, YouTube e Wikipedia che mostrano risultati solo provenienti dallo stesso sito. 

    Fase 1. URL

    Tutto comincia da una lista di URL note. Google le scopre tramite diversi processi, ma i tre più utilizzati sono:

    Dai backlink

    Google ha già un indice contenente miliardi di pagine web. Se qualcuno aggiunge un link ad una tua pagina da una di queste, può trovarla a partire da lì.

    Puoi vedere i backlink del tuo sito gratuitamente con il Site Explorer o con Ahrefs Webmaster Tools.

    1. Iscrivi gratuitamente a Ahrefs Webmaster Tools
    2. Incolla il tuo dominio nel Site Explorer
    3. Vai nel report chiamato Backlinks

    Il nostro crawler è il secondo più attivo dopo Google, dovresti quindi avere una visione piuttosto completa dei tuoi backlink da qui.

    Dalle sitemap

    Le sitemap contengono una lista di tutte le più importanti pagine presenti sul tuo sito. Se invii la tua sitemap a Google, potresti aiutarlo a scoprire il tuo sito più velocemente.

    Dagli invii manuali delle URL

    Google consente anche di segnalare manualmente e individualmente le URL attraverso Google Search Console.

    Fase 2. Scansione

    La fase di scansione—chiamata anche crawling in inglese—è un processo nel quale un bot chiamato spider (ad esempio Googlebot) visita e scarica le pagine scoperte.

    È importante notare che Google non sempre scansione le pagine nell’ordine in cui queste vengono scoperte.

    Google crea un coda di scansione in base ad alcuni fattori, fra cui:

    • Il PageRank della URL
    • Quanto spesso il contenuto di quella URL varia
    • Se è o non è nuova

    Questo è importante perché significa che i motori di ricerca potrebbero scansionare e indicizzare alcune delle tue pagine prima di altre. Se hai un sito molto grande, potrebbe volerci un po’ prima che i motori di ricerca lo scansionino completamente.

    Fase 3. Processazione

    La fase di processazione è quella in cui Google lavora per comprendere ed estrarre le informazioni principali dalle pagine scansionate. Nessuno al di fuori di Google conosce ogni dettaglio di questo processo, ma le parti che ci interessano consistono nell’estrazione dei link e l’immagazzinamento dei contenuti per l’indicizzazione.

    Google deve renderizzare le pagine prima di processarle, ed è proprio questo il momento in cui Google analizza il codice sorgente della pagina per comprendere come questa viene mostrata agli utenti.

    Detto questo, alcune parti della processazione avvengono prima e altre dopo la fase di rendering—come puoi vedere dal diagramma.

    Fase 4. Indicizzazione

    Nella fase di indicizzazione le informazioni processate dalle pagine scansionate vengono aggiunte ad un grande database chiamato indice di ricerca. Essenzialmente si tratta di una libreria digitale composta da miliardi di pagine dalla quale Google estrae i risultati di ricerca.

    Questo è un passaggio importante. Quando cerchi qualcosa all’interno del motore di ricerca, non stai direttamente cercando su internet per un risultato. Stai cercando sull’indice delle pagine web di quel motore di ricerca. Se una pagina non è presente sull’indice, gli utenti non possono trovarla. Questo è il motivo per il quale riuscire a indicizzare le tue pagine sui principali motori di ricerca come Google e Bing è così importante.


    Scoprire, scansionare e indicizzare i contenuti è solo una piccola parte del puzzle. I motori di ricerca hanno anche bisogno di un modo per posizionare i risultati quando un utente compie una ricerca. Questo è il lavoro che spetta agli algoritmi dei motori di ricerca.

    Ogni motore di ricerca ha algoritmi univoci per posizionare le pagine web. Ma dato che Google è il motore di ricerca più utilizzato (almeno in occidente), è quello sul quale ci concentreremo nel resto di questa guida.

    Google ha oltre 200 fattori di posizionamento.

    Nessuno sa quali siano tutti questi fattori, ma conosciamo alcuni dei principali.

    Parliamo di alcuni di questi.

    • Backlink
    • Pertinenza
    • Freschezza
    • Autorevolezza sulla tematica
    • Velocità della pagina
    • Mobile friendly

    Backlink

    I backlink sono uno dei fattori di posizionamento più importanti su Google.

    Andrey Lipattsev, Search Quality Senior Strategist a Google, lo ha confermato durante un live webinar nel 2018. Quando gli è stato chiesto quali fossero i due più importanti fattori di posizionamento, la sua risposta è stata semplice: contenuti e link.

    Assolutamente. Posso dirti quali sono [i due più importanti fattori di posizionamento]. Sono i contenuti. E il link che puntano al tuo sito.

    I link sono stati un importante fattore di posizionamento su Google dal 1997, quando hanno introdotto il PageRank, una formula usata per giudicare il valore di una pagina web in base alla quantità e la qualità dei backlink che riceve.

    Abbiamo analizzato oltre un miliardo di pagine, e abbiamo scoperto che esiste una chiara correlazione fra il numero di siti che fornisce link ad una pagina e il quantitativo di traffico che questa riceve da Google.

    La quantità non è però tutto, in quanto non tutti i link sono uguali. È perfettamente possibile per una pagina con meno link ma di qualità posizionarsi meglio di una con tanti link di bassa qualità.

    Ci sono sei attributi che rendono un link buono.

    Diamo uno sguardo approfondito ai due fattori indubbiamente più importanti: autorevolezza e pertinenza.

    Autorevolezza del link

    I backlink da pagine e siti con autorevolezza sono solitamente quelli che hanno il maggior impatto sul posizionamento.

    Come si definisce l’autorevolezza? Nel contesto della SEO, i siti e le pagine autorevoli sono quelli che hanno molti backlink o ”voti”.

    Ad Ahrefs, abbiamo due metriche per stimare l’autorevolezza relativa delle pagine e dei siti web:

    • Domain Rating (DR): L’autorevolezza relativa di un sito, espresso in una scala da 0–100.
    • URL Rating (UR): L’autorevolezza relativa di una pagina, espressa in una scala da 0–100.

    Puoi analizzare l’autorevolezza di ogni sito o pagina con il Site Explorer di Ahrefs.

    Pertinenza del link

    I link da siti e pagine pertinenti sono solitamente di maggior valore.

    Google parla della pertinenza nel contesto del posizionamento di pagine utili nella sua pagina dedicata a come funziona la ricerca.

    Se altri siti pertinenti sulla tematica hanno link alla pagina, questo è un buon segno che le informazioni contenute sono di alta qualità.

    Se ti stai chiedendo perché la pertinenza è importante, fai un confronto con il mondo reale. Probabilmente ti fideresti del consiglio che ti dà il tuo amico chef quando cerchi un ristorante, piuttosto che fidarti del consiglio del tuo amico veterinario. Ma se stessi cercando un consiglio sul cibo per gatti, sarebbe il contrario.

    Pertinenza

    Google ha molti modi per determinare la pertinenza di una pagina. 

    Al livello base, cerca per pagine che contengono le stesse parole chiave della query di ricerca.

    Ma la pertinenza va ben oltre il semplice riscontro sulle parole chiave.

    Google utilizza anche i dati relativi alle interazioni degli utenti per capire se un determinato risultato è pertinente ad una specifica ricerca. In altre parole, gli utenti reputano la pagina utile? 

    Questo è parte del motivo per il quale i risultati meglio posizionati per “apple” sono relativi all’omonima azienda tech, non il frutto in inglese. Google, in base alle interazioni degli utenti, sà che stanno cercando proprio tale tipologia di informazioni.

    Ma anche in questo caso, i dati sulle interazioni non sono gli unici che permettono a Google di comprendere questa cosa.

    Google ha investito in molte tecnologie per comprendere le relazioni fra le entità come persone, luoghi e cose. Il Knowledge Graph è una di queste tecnologie, che è fondamentalmente un grosso database di entità e le relative relazioni.

    Sia apple (inteso come il frutto) che Apple (l’azienda) sono entità all’interno del Knowledge Graph.

    Google utilizza le relazioni fra le entità per comprendere meglio la pertinenza di una pagina. Un risultato pertinente per “apple” che parla di arance e banane è chiaramente inerente la frutta. Ma uno che parla di iPhone, iPad, e iOS è ovviamente pertinente all’azienda tech.

    È in parte grazie al Knowledge Graph che Google può andare oltre il semplice riscontro sulle parole chiave.

    Talvolta potresti vedere dei risultati che falliscono nel menzionare quelle che sembrano essere importanti parole chiave per una determinata query. Ad esempio, il secondo risultato per “apple paper app”, che non menziona la parola “apple” da nessuna parte sulla pagina.

    Google è in grado di capire che si tratta di un risultato pertinente in parte perché menziona entità come iPhone e iPad, che sono strettamente correlate ad Apple all’interno del Knowledge Graph.

    Nota a margine.
    I dati sulle interazioni ed il Knowledge Graph non sono le uniche tecnologie che Google utilizza per comprendere la pertinenza di una pagina web a una determinata query. Molto del lavoro è compiuto utilizzando tecnologie che comprendono il significato e l’intento dietro la query stessa, come BERT e RankBrain. Google talvolta riscrive addirittura le query dietro le quinte per fornire risultati rilevanti. 

    Freschezza

    La freschezza è un fattore di posizionamento dipendente dalla query stessa, nel senso che può avere più o meno peso a seconda del caso.

    Per query come “cosa c’è di nuovo su amazon prime” (o “what’s new on amazon prime” in inglese), la freschezza è particolarmente importante, perché l’utente vuole venire a conoscenza di nuovi film e serie aggiunti di recente.

    Per query come “migliori cuffie” (o “best headphones” in inglese), la freschezza non è così importante. La tecnologia dietro le cuffie si muove velocemente, quindi un risultato del 2015 non sarà eccellente, ma uno pubblicato 2–3 mesi fa probabilmente si.

    Google questo lo sa, e mostra risultati che sono stati pubblicati o aggiornati negli scorsi mesi.

    Esistono anche query dove la freschezza è praticamente irrilevante, come “come fare il nodo alla cravatta” (o “how to tie a tie” in inglese). Nulla è cambiato riguardo questo processo, quindi non importa se i risultati siano di ieri o del 1998. Google lo sa, e non si fa scrupoli nel pubblicare articoli risalenti ad anni fa.

    Autorevolezza sulla tematica—o topical authority

    Google vuole posizionare contenuti da siti che sono autorevoli sulla tematica. Questo si traduce nel fatto che Google potrebbe reputare un sito come un’ottima fonte per le query su di una tematica ma non su di un’altra.

    Google ne parla in uno dei suoi brevetti:

    Il sistema di ricerca reputa un sito autorevole in base alla query. […] il sistema di ricerca può considerare il sito per il Centers for Disease Control, “cdc.gov,” autorevole per la query “CDC mosquito stop bites”, ma non così autorevole per “restaurant recommendations”.

    Anche se questo è solo uno dei tanti brevetti depositati da Google, possiamo vedere l’importanza della “topical authority” sulle pagine di ricerca per molte query.

    Guarda ad esempio ai risultati per “macchina sottovuoto per cottura” (o “sous vide vacuum sealer” in inglese). 

    Possiamo vedere due piccoli siti verticali alla cottura sottovuoto che si posizionano meglio del New York Times.

    Anche se entrano in gioco molti altri fattori in questo caso, sembra che la ‘autorevolezza sulla tematica’ sia uno dei motivi per cui questi siti riescono a posizionarsi in questo modo.

    Probabilmente questo è uno dei motivi per i quali Google nella sua guida base alla SEO dice ai proprietari dei siti:

    Creati una reputazione forte e credibile come esperto in uno specifico ambito.

    Velocità della pagina

    A nessuno piace aspettare che una pagina si carichi, e Google lo sa. Questo è il motivo per cui hanno reso la velocità di caricamento di una pagina un fattore di posizionamento per le ricerche desktop nel 2010, e per le ricerche da mobile nel 2018.

    Molte persone diventano ossessionate dal ‘page speed’, quindi è necessario sottolineare come le tue pagine non devono caricarsi alla velocità della luce per posizionarsi. Google sottolinea come questo sia solo un problema per le pagine che “forniscono un’esperienza di navigazione particolarmente lenta agli utenti”.

    In altre parole, migliorare il caricamento di qualche millisecondo su un qualcosa già veloce non avrà probabilmente nessun impatto sul posizionamento. Deve solo essere veloce abbastanza da non impattare negativamente gli utenti.

    Puoi analizzare la velocità di caricamento di qualsiasi pagina con il PageSpeed Insights, che fornisce anche consigli su come rendere la pagina più veloce.

    PageSpeed Insightsmostra anche come se la cava la tua pagina in relazione ai Core Web Vitals.

    I Core Web Vitals sono tre metriche che giudicano la performance in termini di velocità di caricamento, interattività e stabilità delle tue pagine web. Google ha confermato come i Core Web Vitals saranno un fattore di posizionamento a partire da Giugno 2021.

    Puoi vedere le prestazioni di tutte le tue pagine sul tuo sito tramite il report Core Web Vitals presente in Google Search Console.

    Se molte URL performano male o sono da migliorare, parla con uno sviluppatore.

    Mobile friendly

    Il 65% delle ricerche su Google proviene da smartphone. Questo è il motivo per cui essere mobile friendly è un fattore di posizionamento sulle ricerche da mobile a partire dal 2015.

    Dal 2019, essere mobile friendly è un fattore di ranking anche su desktop, grazie allo switch compiuto da Google verso il mobile-first indexing. Questo significa che Google “utilizza in maniera predominante il contenuto della versione mobile per indicizzazione e posizionamento” su tutti i dispositivi.

    In altre parole, un sito che non è mobile friendly ha dei punti di svantaggio in termini di posizionamento—su ogni dispositivo.

    Puoi verificare se ogni pagina del tuo sito sia o meno mobile friendly con il Mobile-Friendly Test tool di Google, o nel report chiamato Usabilità su dispositivi mobili all’interno di Google Search Console.


    I motori di ricerca comprendono che ogni persona ha diverse necessità in termini di risultati cercati. Questo è il motivo per cui tendono a personalizzarli per ogni utente.

    Se hai mai cercato la stessa cosa da diversi dispositivi o browser, avrai probabilmente avuto modo di vedere gli effetti di questa personalizzazione. I risultati spesso vengono mostrati in posizioni differenti a seconda di diversi fattori.

    Proprio a causa di questa personalizzazione, se ti occupi di SEO, faresti meglio a utilizzare uno strumento dedicato come il Rank Tracker di Ahrefs per tenere traccia dei tuoi posizionamenti. I posizionamenti riportati da questi strumenti sono probabilmente quelli più vicine alla realtà, perché analizzano il web in una maniera che non dà modo ai motori di ricerca di carpire informazioni per personalizzare i risultati.

    Ma fino a che punto i motori di ricerca personalizzano i risultati?

    Google dice che “le informazioni come la tua posizione, le ricerche passate e le impostazioni delle ricerche li aiutano a personalizzare i risultati di ricerca proponendo risultati più utili e pertinenti in quel determinato momento”.

    Diamo uno sguardo a questi tre fattori.

    1. Posizione

    Se cerchi qualcosa come “ristorante italiano” (o “italian restaurant” in inglese), tutti i risultati sul pack mappa saranno ristoranti locali.

    Google lo fa perchè sà che non ci sono molte possibilità che tu possa viaggiare a migliaia di chilometri di distanza per un pranzo.

    Ma Google utilizza la posizione anche per personalizzare i risultati che si trovano al di fuori della mappa. Se scorriamo sotto di essa infatti, sempre all’interno della ricerca compiuta qui sopra, possiamo vedere come anche i risultati provenienti da TripAdvisor siano personalizzati. E vediamo che la maggior parte dei siti posizionati sono quelli di ristoranti locali.

    Stessa cosa per “comprare casa” (o “buy a house” in inglese). Google restituisce le pagine con risultati dalle zone limitrofe invece che quelle nazionali, perché ci sono molte probabilità che tu non voglia spostarti così lontano.

    La tua posizione impatta i risultati per le query locali così drasticamente che non ci sono praticamente similitudini per due persone che cercano la stessa cosa da due posizioni differenti.

    2. Lingua

    Google sà che non c’è motivo di mostrare risultati in inglese a chi parla spagnolo. Questo è il motivo per cui Google posiziona la versione inglese della nostra guida sulla SEO per YouTube per le ricerche in inglese e quella spagnola per le ricerche in spagnolo.

    In ogni caso, Google si affida anche ai proprietari dei siti per fare ciò. Se hai pagine in diverse lingue, Google potrebbe non accorgersene a meno che tu non glielo dica espressamente. 

    Puoi fare ciò con un attributo HTML chiamato hreflang.

    L’hreflang è un pò complicato e va oltre lo scopo di questa guida, ma essenzialmente è una porzione di codice che indica le relazioni fra diverse versioni di una stessa pagina in diverse lingue.

    3. Cronologia di ricerca

    Probabilmente l’esempio più ovvio di Google che utilizza la cronologia di ricerca è quando personalizza i risultati ‘posizionando’ un risultato sul quale hai già fatto click in una posizione più alta per la stessa ricerca.

    Non accade sempre, ma spesso—specialmente se fai click o visiti una pagina più volte in un breve intervallo di tempo.

    Per concludere

    Comprendere come funzionano i motori di ricerca è il primo passo per posizionarsi più in alto su Google e ottenere più traffico. Se i motori di ricerca non possono trovare, scansionare e indicizzare le tue pagine, rimarrai nel fondo della bottiglia. 

    Se vuoi approfondire come cominciare ad ottimizzare il tuo sito per la SEO, leggi la nostra guida alle basi della SEO.

    Domande? Fammelo sapere nei commenti, o scrivimi su Twitter.