Seo Office Hours, 3 giugno 2022

Pubblicato: 2022-07-04

Questo è un riepilogo delle domande e risposte più interessanti del Google SEO Office Hours con John Mueller del 3 giugno 2022.

I contenuti si nascondono
1 Posso utilizzare due codici risultato HTTP su una pagina?
2 L'utilizzo di una CDN migliora le classifiche se il mio sito è già veloce nel mio paese principale?
3 Devo impedire le richieste API per ridurre la scansione?
4 Devo usare rel="nofollow" sui link interni?
5 C'è un modo per forzare la visualizzazione dei sitelink?
6 Il nostro sito incorpora PDF con iframe, dovremmo eseguire l'OCR del testo?
7 Google esegue la scansione degli URL nel markup dei dati strutturati?

Posso utilizzare due codici risultato HTTP su una pagina?

1:22 “[…] In teoria è possibile avere due diversi codici di risultato HTTP su una pagina, ma cosa farà Google con questi due codici? Google li vedrà anche? E se sì, cosa farà Google? Ad esempio, un 503 più un 302".

La risposta di John è stata: “[…] Con i codici dei risultati HTTP, puoi includere molte cose diverse. Google esaminerà il primo codice risultato HTTP e sostanzialmente lo elaborerà.

E in teoria puoi ancora avere due o più codici risultato HTTP se sono reindirizzamenti che portano a qualche pagina finale. Quindi, ad esempio, potresti avere un reindirizzamento da una pagina a un'altra pagina. Questo è un codice risultato. E poi in quell'altra pagina, potresti pubblicare un codice di risultato diverso. Quindi potrebbe essere un reindirizzamento 301 a una pagina 404 […]. E dal nostro punto di vista, in quelle situazioni a catena in cui possiamo seguire il reindirizzamento per ottenere un risultato finale, ci concentreremo essenzialmente solo su quel risultato finale.

E se quel risultato finale ha dei contenuti, allora è qualcosa che potremmo essere in grado di usare per la canonizzazione. Se il risultato finale è una pagina di errore, allora è una pagina di errore. E va bene anche per noi".

L'utilizzo di una CDN migliora le classifiche se il mio sito è già veloce nel mio paese principale?

2:50 “[…] Otteniamo la maggior parte del nostro traffico da un paese specifico. Abbiamo ospitato il nostro sito Web su un server situato in quel paese. Suggerisci di mettere il nostro intero sito Web dietro un CDN per migliorare la velocità della pagina per gli utenti a livello globale, o nel nostro caso non è necessario?"

John ha risposto: “ Non credo che avrebbe un grande effetto su Google per quanto riguarda la SEO.

L'unico effetto in cui potrei immaginare che potrebbe accadere qualcosa è ciò che gli utenti finiscono per vedere. […] Se la maggior parte dei tuoi utenti vede già un sito web molto veloce perché il tuo server si trova lì, allora stai […] facendo la cosa giusta. Ma ovviamente, se gli utenti in altre località vedono un risultato molto lento, perché forse la connessione con il tuo paese non è eccezionale, allora è qualcosa in cui potresti avere alcune opportunità per migliorarlo.

[…] Se c'è qualcosa che puoi fare per migliorare le cose a livello globale per il tuo sito web, penso che sia una buona idea. Non credo sia fondamentale […]. Ma è qualcosa che puoi fare per […] far crescere il tuo sito web oltre il tuo paese attuale.

Forse una cosa che dovrei chiarire, se la scansione di Google è davvero molto lenta, ovviamente ciò può influire su quanto possiamo eseguire la scansione e l'indicizzazione dal sito Web […]. Non ho davvero visto questo come un problema per quanto riguarda qualsiasi sito Web che non sia grande milioni e milioni di pagine […].

Puoi ricontrollare la velocità di scansione di Google in Search Console e le statistiche di scansione. E se sembra ragionevole, anche se non è super veloce, allora non me ne preoccuperei davvero”.

Devo impedire le richieste API per ridurre la scansione?

5:20 “[…] Il nostro sito attualmente spende circa il 20% del budget di scansione per il sottodominio API, un altro 20% per le miniature delle immagini dei video. Nessuno di questi sottodomini ha contenuti che fanno parte della nostra strategia SEO. Dovremmo impedire la scansione di questi sottodomini o come vengono scoperti o utilizzati gli endpoint API?"

Come ha affermato John, "[...] In molti casi, gli endpoint API finiscono per essere utilizzati da JavaScript su un sito Web e noi renderemo le tue pagine. E se accedono a un'API che si trova sul tuo sito web, proveremo a caricare il contenuto da quell'API e lo utilizzeremo per il rendering della pagina.

E a seconda di come è impostata la tua API e di come è impostato il tuo JavaScript, potrebbe essere difficile per noi memorizzare nella cache quei risultati API, il che significa che forse eseguiamo la scansione di molte di queste richieste API per provare a ottenere una versione renderizzata delle tue pagine in modo da poterle utilizzare per l'indicizzazione. Quindi di solito è il luogo in cui questo viene scoperto. Ed è qualcosa che puoi aiutare assicurandoti che i risultati dell'API possano essere memorizzati nella cache, che non inietti alcun timestamp negli URL […] quando usi JavaScript per l'API […].

Se non ti interessa il contenuto restituito con questi endpoint API, puoi ovviamente impedire che l'intero sottodominio venga scansionato con il file robots.txt. E ciò essenzialmente bloccherà l'esecuzione di tutte quelle richieste API.

[…] Prima di tutto devi capire, questi risultati API […] fanno parte di […] contenuti critici che voglio avere indicizzato da Google? E se è così, probabilmente non dovresti bloccare la scansione. Ma se […] sta […] generando qualcosa […] che non è fondamentale per le tue pagine […], allora potrebbe essere utile ricontrollare come appare quando sono bloccate.

E un modo per ricontrollarlo è creare una pagina di test separata che non chiami l'API o che utilizzi un URL non funzionante per l'endpoint API. […] Puoi vedere come viene effettivamente visualizzata questa pagina nel mio browser? Come viene visualizzato per Google?"

Dovrei usare rel="nofollow" sui link interni?

8:05 "È appropriato utilizzare un attributo nofollow sui collegamenti interni per evitare inutili richieste del crawler agli URL di cui non desideriamo eseguire la scansione o l'indicizzazione?"

Ecco come John ha risposto: “[…] Penso che, per la maggior parte, non abbia molto senso usare nofollow sui link interni. Ma se è qualcosa che vuoi fare, fallo.

Nella maggior parte dei casi, proverò a fare qualcosa come usare rel=canonical per puntare agli URL che vuoi avere indicizzato o usando robots.txt per cose di cui non vuoi che vengano scansionate.

Prova a capire, è più una cosa sottile […] che preferisci avere indicizzato e poi usare rel=canonical per quello? O è qualcosa in cui dici tu, in realtà, quando Googlebot accede a questi URL, causa problemi al mio server. Provoca un grande carico. Rende tutto molto lento. È costoso o cosa hai.

E per questi casi, non consentirei la scansione di quegli URL. […] Con rel=canonical, ovviamente, dovremo prima eseguire la scansione di quella pagina per vedere rel=canonical. Ma col tempo, ci concentreremo sul canonico che hai definito. E lo useremo principalmente per la scansione e l'indicizzazione".

C'è un modo per forzare la visualizzazione dei sitelink?

16:02 "Esiste una strategia in base alla quale le pagine desiderate possono apparire come link a un sito nei risultati di ricerca di Google?"

John ha chiarito che "[...] Non ci sono meta tag o dati strutturati che puoi utilizzare per imporre la visualizzazione di un collegamento al sito .

[…] I nostri sistemi cercano di capire cosa è […] correlato o rilevante per gli utenti quando guardano questa pagina web […]? […] La nostra raccomandazione è essenzialmente quella di avere una buona struttura del sito web, di avere collegamenti interni chiari in modo che sia facile per noi riconoscere quali pagine sono correlate a quelle pagine e di avere titoli chiari che possiamo usare e […] mostrare come un collegamento al sito.

[…] Non è che ci sia una garanzia che tutto questo verrà mostrato in quel modo. Ma in qualche modo ci aiuta a capire cosa è correlato. E se pensiamo che abbia senso mostrare un collegamento a un sito, sarà molto più facile per noi sceglierne effettivamente uno in base a tali informazioni".

Il nostro sito incorpora PDF con iframe, dovremmo eseguire l'OCR del testo?

17:14 “Il nostro sito Web utilizza iframe e uno script per incorporare file PDF nelle nostre pagine e nel nostro sito Web. C'è qualche vantaggio nel prendere il testo OCR del PDF e incollarlo da qualche parte nell'HTML del documento per scopi SEO, o Google semplicemente analizzerà il contenuto del PDF con lo stesso peso e rilevanza per indicizzare il contenuto?"

John ha risposto: “[…] Sembra che tu voglia prendere il testo del PDF e […] nasconderlo nell'HTML per scopi SEO. Ed è qualcosa che non consiglierei assolutamente di fare. Se vuoi che il contenuto sia indicizzabile, rendilo visibile sulla pagina.

[…] Cerchiamo di estrarre il testo dai PDF e di indicizzarlo per i PDF stessi. Da un punto di vista pratico, quello che succede con un PDF è come uno dei primi passi, lo convertiamo in una pagina HTML e proviamo a indicizzarla come una pagina HTML. […] Quello che stai facendo è […] creare un iframe di una pagina HTML indiretta. E quando si tratta di iframe, possiamo tenere conto di quel contenuto per l'indicizzazione all'interno della pagina principale. Ma può anche succedere che indicizziamo comunque il PDF separatamente. […] Rigirerei la domanda e la inquadrerei come cosa vuoi che accada?

E se vuoi che le tue normali pagine web siano indicizzate con il contenuto del file PDF, fai in modo che quel contenuto sia immediatamente visibile sulla pagina HTML. Quindi, invece di incorporare il PDF come parte principale del contenuto, rendi il contenuto HTML come parte principale e collegalo al file PDF.

E poi c'è una domanda: vuoi quei PDF indicizzati separatamente o no? A volte vuoi avere i PDF indicizzati separatamente. E se vuoi indicizzarli separatamente, il collegamento ad essi è fantastico.

Se non vuoi che vengano indicizzati separatamente, va bene anche usare robots.txt per bloccarne l'indicizzazione. Puoi anche usare noindex [? x-robots?] Intestazione HTTP. È un po' più complicato perché devi servirlo come intestazione per i file PDF se vuoi avere quei file PDF disponibili nell'iframe, ma non effettivamente indicizzati. "

Google esegue la scansione degli URL nel markup dei dati strutturati?

23:24 "Google esegue la scansione degli URL che si trovano nel markup dei dati strutturati o Google memorizza semplicemente i dati?"

John ha spiegato che "Per la maggior parte, quando guardiamo le pagine HTML, se vediamo qualcosa che assomiglia a un collegamento, potremmo uscire e provare anche quell'URL. […] Se troviamo un URL in JavaScript, possiamo provare a prenderlo e provare a usarlo. Se troviamo un collegamento in un file di testo su un sito, possiamo provare a scansionarlo e utilizzarlo. Ma non è proprio un collegamento normale.

[…] Se vuoi che Google si spenga e esegua la scansione di quell'URL, assicurati che ci sia un collegamento HTML naturale a quell'URL , con un testo di ancoraggio chiaro, che fornisca alcune informazioni sulla pagina di destinazione.

Se non vuoi che Google esegua la scansione di quell'URL specifico, allora magari bloccalo con robots.txt o su quella pagina, usa un rel=canonical che punta alla tua versione preferita, qualcosa del genere. […] Non presumerei ciecamente che solo perché è nei dati strutturati non verrà trovato, né presumerei ciecamente che solo perché è nei dati strutturati verrà trovato.

[…] Mi concentrerei invece su ciò che vuoi che accada lì. Se vuoi che sia visto come un link, fallo diventare un link. Se non vuoi che venga scansionato o indicizzato, blocca la scansione o l'indicizzazione […]."