Verificatore Dimensione Scansione Googlebot
Controlla la dimensione non compressa di qualsiasi URL (HTML o PDF) per assicurarti che rientri nei limiti di scansione di Googlebot. Rileva se il contenuto supera la soglia di elaborazione (es. 2MB per HTML, 64MB per PDF) e previeni l'indicizzazione parziale.
Il tuo ad blocker ci impedisce di mostrare annunci
MiniWebtool è gratuito grazie agli annunci. Se questo strumento ti è stato utile, sostienici con Premium (senza annunci + più veloce) oppure inserisci MiniWebtool.com nella whitelist e ricarica la pagina.
- Oppure passa a Premium (senza annunci)
- Consenti gli annunci per MiniWebtool.com, poi ricarica
Verificatore Dimensione Scansione Googlebot
Il Verificatore Dimensione Scansione Googlebot misura la dimensione non compressa di qualsiasi pagina web o PDF per verificare che rientri nei limiti ufficiali di scansione di Googlebot. Quando una pagina supera questi limiti, Googlebot tronca il contenuto che elabora, causando potenzialmente l'ignoranza di informazioni importanti, dati strutturati e link durante l'indicizzazione.
Comprendere i limiti di dimensione della scansione di Googlebot
Google documenta ufficialmente soglie di dimensione specifiche per diversi tipi di file. Quando Googlebot raggiunge questi limiti, interrompe il download ed elabora solo il contenuto che ha già recuperato:
- HTML e file supportati: Googlebot esegue la scansione dei primi 2 MB di contenuto non compresso. Questo include il documento HTML stesso insieme a qualsiasi CSS e JavaScript inline. Le risorse esterne (fogli di stile, script, immagini) vengono recuperate separatamente, ognuna con i propri limiti.
- File PDF: Googlebot scansiona i primi 64 MB di un documento PDF. Sebbene si tratti di un limite generoso, i report o i cataloghi PDF molto grandi dovrebbero comunque essere controllati.
Questi limiti si applicano alla dimensione del contenuto non compresso, non alla dimensione del trasferimento compresso che potresti vedere negli strumenti di rete. Anche se il tuo server invia risposte compresse in formato gzip, Googlebot misura l'intera dimensione decompressa.
Perché la dimensione della pagina è importante per la SEO
Troncamento dell'indicizzazione
Se la tua pagina supera il limite di dimensione, tutto ciò che si trova oltre la soglia è invisibile a Google. Ciò può causare:
- Importanti contenuti del corpo che non vengono indicizzati
- Dati strutturati (schemi JSON-LD) in fondo alla pagina che vengono saltati
- Link interni nel footer o nella navigazione inferiore che non vengono scoperti
- Risultati multimediali e funzioni di ricerca che non appaiono nei risultati di ricerca
Cause comuni di pagine di grandi dimensioni
- Eccessivo CSS/JavaScript inline: Grandi framework o librerie di componenti incorporati direttamente nell'HTML
- Contenuto reso lato server (SSR): SPA che serializzano grandi payload di dati nell'HTML
- Pagine di elenco prodotti lunghe: Pagine di categoria e-commerce con centinaia di prodotti
- Commenti HTML prolissi: Strumenti di build che iniettano grandi blocchi di commenti
- Dati incorporati: Immagini codificate in Base64 o grandi dati JSON nel sorgente della pagina
Come funziona questo strumento
- Recupero con UA di Googlebot: Lo strumento richiede il tuo URL utilizzando la stringa ufficiale dello user-agent di Googlebot, richiedendo contenuto non compresso (
Accept-Encoding: identity) per misurare la vera dimensione non compressa. - Rilevamento tipo di contenuto: Rileva automaticamente se la risposta è HTML o PDF e applica il limite corrispondente (2 MB o 64 MB).
- Misurazione e analisi: La dimensione del contenuto non compresso viene misurata e confrontata con il limite. Per l'HTML, viene fornita una suddivisione di CSS inline, JavaScript e commenti.
- Tracciamento dei reindirizzamenti: Vengono rilevati e visualizzati eventuali reindirizzamenti HTTP (301, 302, ecc.), mostrando l'intera catena di reindirizzamento dall'URL originale a quello finale.
Come ridurre la dimensione della pagina
Sposta il codice inline in file esterni
L'ottimizzazione più efficace consiste nello spostare i grandi blocchi inline <style> e <script> in file CSS e JavaScript esterni. Ogni file esterno ottiene il proprio limite di 2 MB e viene memorizzato nella cache dal browser.
Rimuovi il contenuto non necessario
- Elimina i commenti HTML dalle build di produzione
- Rimuovi i blocchi di contenuto nascosti o duplicati
- Minimizza il CSS e il JavaScript inline
- Rimuovi gli attributi di dati inutilizzati e gli elementi vuoti
Ottimizza la struttura della pagina
- Usa la paginazione per pagine con contenuti lunghi invece dello scroll infinito
- Carica in modo differito (lazy-load) le sezioni di contenuto sotto la piega (below-the-fold)
- Riduci la profondità del DOM e il numero di elementi
- Sposta i grandi payload di dati verso endpoint API
Come controllare la dimensione della tua pagina rispetto ai limiti di Googlebot
- Inserisci il tuo URL: Digita o incolla l'URL completo della pagina che vuoi controllare nel campo di input. Lo strumento accetta sia URL HTTP che HTTPS.
- Fai clic su Controlla Dimensione: Fai clic sul pulsante "Controlla dimensione scansione". Lo strumento recupererà la pagina utilizzando lo user-agent di Googlebot e misurerà la dimensione del contenuto non compresso.
- Esamina i risultati: Visualizza l'indicatore grafico che mostra la dimensione della pagina rispetto al limite, l'analisi della suddivisione dei contenuti e raccomandazioni specifiche per l'ottimizzazione, se necessario.
Domande frequenti
Quali sono i limiti di dimensione della scansione di Googlebot?
Googlebot esegue la scansione dei primi 2 MB di HTML e dei tipi di file supportati (come CSS e JavaScript). Per i file PDF, Googlebot scansiona i primi 64 MB. Qualsiasi contenuto oltre questi limiti potrebbe non essere elaborato o indicizzato da Google. Questi limiti si applicano alla dimensione del file non compresso, non alla dimensione del trasferimento compresso.
Cosa succede se la mia pagina supera il limite di dimensione di Googlebot?
Se la pagina supera il limite di dimensione della scansione, Googlebot elaborerà solo il contenuto entro il limite e ignorerà il resto. Ciò significa che contenuti importanti, dati strutturati o link in fondo alla pagina potrebbero non essere indicizzati. Questo può portare a un'indicizzazione incompleta, alla mancanza di funzioni di ricerca (come i risultati multimediali) e a scarse prestazioni SEO.
Il limite di 2 MB si applica al contenuto compresso o non compresso?
Il limite di 2 MB si applica al contenuto non compresso. Anche se il server invia risposte compresse (gzip o brotli), Googlebot misura la dimensione non compressa dopo la decompressione. Questo strumento richiede contenuti non compressi per fornirti una misurazione accurata di ciò che Googlebot elabora effettivamente.
Come posso ridurre la dimensione della mia pagina per rientrare nei limiti di Googlebot?
Per ridurre la dimensione della pagina: (1) Sposta il CSS inline in fogli di stile esterni, (2) Sposta il JavaScript inline in file esterni, (3) Rimuovi i commenti HTML non necessari, (4) Riduci al minimo la profondità e la complessità del DOM, (5) Usa il rendering lato server in modo selettivo, (6) Carica in modo differito i contenuti non critici, (7) Rimuovi i contenuti nascosti o duplicati, (8) Usa la paginazione per pagine con contenuti molto lunghi.
Googlebot scansiona i file CSS e JavaScript esterni separatamente?
Sì, Googlebot recupera singolarmente ogni risorsa esterna CSS, JavaScript e immagine. Ogni risorsa esterna ha il proprio limite di 2 MB. Solo gli stili e gli script inline all'interno del documento HTML contano ai fini del limite di 2 MB della pagina principale. Ecco perché spostare grandi blocchi di codice inline in file esterni è una strategia di ottimizzazione efficace.
Risorse aggiuntive
Cita questo contenuto, pagina o strumento come:
"Verificatore Dimensione Scansione Googlebot" su https://MiniWebtool.com/it// di MiniWebtool, https://MiniWebtool.com/
dal team miniwebtool. Aggiornato: 10 feb 2026 | Fonte: Google Search Central - Googlebot