Gerador de Robots.txt

Crie um arquivo robots.txt pronto para produção para mecanismos de busca e valide as diretivas antes de publicar. Gere regras globais e específicas para bots, adicione dicas de sitemap e rastreamento, e evite erros comuns como grupos de user-agent ausentes, URLs de sitemap inválidas ou padrões de desativação muito amplos.

▦ Exemplos rápidos

Carregue um modelo completo para gerar um arquivo robots.txt prático para um site real, teste uma política de rastreamento mais restrita para e-commerce ou cole um arquivo existente para inspecioná-lo antes da publicação.

Modo

Escolha o fluxo de trabalho

Ação Gere um novo arquivo robots.txt a partir de campos estruturados ou valide um arquivo que você já possui.

Básico

Defina o contexto do site

URL do Site Usado para transformar caminhos de sitemap em URLs absolutas como `https://exemplo.com.br/sitemap.xml`.

User-agent principal Use `*` para todos os rastreadores ou segmente um bot específico como `Googlebot`.

Comentário de cabeçalho Linha de comentário opcional para o topo do arquivo gerado. Mantenha-a funcional e curta.

Regras

Defina caminhos globais de permissão e bloqueio

Diretivas Allow (Permitir) Um caminho por linha. Exemplo: `/` ou `/wp-admin/admin-ajax.php`.

Diretivas Disallow (Bloquear) Bloqueie áreas de baixo valor como `/carrinho/`, `/checkout/`, `/busca` ou `/admin/` quando apropriado.

Bots

Adicione sitemap e seções específicas de bots

URLs de Sitemap Um sitemap por linha. Caminhos relativos são convertidos em relação à URL do site.

Blocos adicionais de user-agent Cole grupos brutos de `User-agent:` aqui para bots de imagem, bots de anúncios ou regras de homologação.

Crawl-delay Opcional. Esta diretiva não é suportada uniformemente por todos os mecanismos de busca.

Host Opcional. Geralmente um nome de host simples como `exemplo.com.br`.

Diretivas Clean-param Opcional. Regras de limpeza de parâmetros específicas de mecanismos, uma diretiva por linha.

Validação

Cole o arquivo que você deseja verificar

Conteúdo do Robots.txt Cole o arquivo existente exatamente como ele aparece, incluindo comentários e múltiplos grupos de rastreadores.

Guia

O que esta ferramenta verifica

O relatório procura por problemas estruturais, como grupos de `User-agent` ausentes, URLs de sitemap não absolutas, valores de `Crawl-delay` não numéricos e padrões que podem bloquear recursos importantes ou todo o site.

Use o robots.txt para gerenciamento de rastreamento, não como uma barreira de segurança para conteúdo sensível.
Busca interna, carrinho, checkout e caminhos de administração são candidatos comuns para `Disallow`.
Não bloqueie casualmente CSS, JavaScript ou recursos compartilhados que ajudam os mecanismos de busca a renderizar a página.
Publique o arquivo final na raiz do domínio para que a URL ativa seja `https://exemplo.com.br/robots.txt`.

User-agent Allow / Disallow Sitemap Crawl-delay

A área de resultados inclui o arquivo final, um resumo do rastreamento e um conjunto de avisos ou notas que você pode revisar antes da implantação.

Embed Gerador de Robots.txt Widget

Gerador de Robots.txt

Um arquivo robots.txt informa aos rastreadores quais partes de um site eles podem buscar, quais caminhos devem ficar fora da fila de rastreamento e onde reside o sitemap XML. Para visibilidade de SEO e GEO, o objetivo não é bloquear tudo o que é arriscado por padrão. O objetivo é proteger caminhos de rastreamento de baixo valor, preservar o orçamento de rastreamento (crawl budget) para páginas canônicas e manter o arquivo alinhado com o que é realmente público no domínio. Uma política de robots.txt útil geralmente menciona seções concretas, como pastas de administração, fluxos de checkout, URLs de pesquisa interna, filtros facetados ou blocos exclusivos de homologação, em vez de "configurações de SEO" vagas.

Como Usar

Escolha o modo gerar ou validar. Use `Gerar robots.txt` para construir um novo arquivo a partir de entradas estruturadas, ou mude para `Validar robots.txt existente` se você já tiver um rascunho ou arquivo ativo.
Insira as regras de rastreamento e detalhes do sitemap. Adicione a URL pública do site, seu `User-agent` principal, um caminho de permissão ou bloqueio por linha e quaisquer seções extras específicas de bot ou URLs de sitemap que você precisar.
Crie o relatório. Execute a ferramenta para construir o arquivo final, revise os grupos de rastreadores analisados e inspecione avisos para padrões arriscados, como recursos bloqueados ou URLs de sitemap absolutas ausentes.
Publique apenas após a revisão. Copie a saída quando as regras refletirem sua real intenção de rastreamento, então coloque o arquivo em `/robots.txt` no hostname ativo e teste a URL implantada.

Estratégia de Diretivas e Erros Comuns

Diretiva ou Padrão	Quando Ajuda	O que Frequentemente dá Errado
`User-agent: *`	Cria um conjunto de regras globais para a maioria dos bots quando nenhum tratamento especial é necessário.	As pessoas adicionam linhas `Allow` e `Disallow` antes de definir qualquer grupo de user-agent, o que enfraquece a clareza do analisador.
`Disallow: /busca`	Útil para bloquear páginas de busca interna do site que criam combinações de URLs ralas e duplicadas.	Bloquear páginas públicas de categorias ou produtos por acidente porque o padrão do caminho é mais amplo do que o pretendido.
`Sitemap: https://exemplo.com.br/sitemap.xml`	Ajuda os rastreadores a descobrir URLs canônicas e novos conteúdos mais rapidamente.	Usar um caminho relativo ou uma URL de sitemap de homologação desatualizada em produção.
`Crawl-delay`	Às vezes adicionado para rastreadores que documentam suporte para limitação de solicitações.	Presumir que o Google o obedece. O Google ignora o `Crawl-delay`, portanto não é um mecanismo universal de controle de taxa.
`Disallow: /assets/js/`	Raramente necessário em um site público normal.	Bloquear recursos de renderização que os mecanismos de busca usam para entender o layout, funcionalidade e qualidade da página.

Casos de Uso Práticos

Em um site WordPress, uma regra comum é desautorizar `/wp-admin/` enquanto permite `/wp-admin/admin-ajax.php`, pois isso mantém a maioria das telas de administração fora dos caminhos de rastreamento sem bloquear um endpoint frequentemente necessário. Em um site de e-commerce, o robots.txt é frequentemente usado para limitar o desperdício de rastreamento em páginas de carrinho, áreas de conta, fluxos de checkout, navegação facetada ou páginas de resultados internos geradas por parâmetros de ordenação e filtro. Em um site de homologação (staging), um bloqueio temporário em todo o site pode ser razoável, mas deve ser removido antes do lançamento e verificado novamente após mudanças de DNS ou implantação.

O validador também é útil ao herdar um arquivo de outra equipe. Ele pode capturar problemas sutis como uma linha de sitemap não absoluta, uma diretiva `Host` malformada ou um valor de `Crawl-delay` escrito como texto simples em vez de um número. Esses detalhes importam porque um arquivo robots.txt é simples, mas erros de produção geralmente também são simples.

O que o Robots.txt Não Faz

O robots.txt é um arquivo de gerenciamento de rastreamento, não um sistema de controle de acesso e nem um interruptor de desindexação garantido. Se uma URL estiver bloqueada, mas tiver links em outros lugares, os mecanismos de busca ainda poderão exibir essa URL nos resultados de pesquisa sem rastrear seu conteúdo completo. Documentos sensíveis, ferramentas de administração e ambientes privados devem ser protegidos com autenticação, restrições de rede ou estratégias explícitas de noindex em páginas rastreáveis. Essa distinção é um dos mal-entendidos mais comuns em conversas de SEO técnico.

FAQ

O que um arquivo robots.txt deve conter para um site público normal?

Um arquivo de produção sensato geralmente começa com um grupo User-agent, bloqueia apenas caminhos de rastreamento de baixo valor ou privados, como áreas administrativas, páginas de busca interna, fluxos de carrinho ou telas de conta, e inclui uma URL de sitemap com o protocolo e nome de host completos. A maioria dos sites públicos não deve bloquear CSS, JavaScript ou suas pastas principais de conteúdo.

O robots.txt impede que uma página seja indexada?

Não, não por si só. O robots.txt diz aos rastreadores o que não buscar, mas uma URL bloqueada ainda pode ser indexada com base em links externos ou sinais descobertos anteriormente. Se o seu objetivo real for o controle de índice, você precisará de um método projetado para esse fim, como noindex em páginas rastreáveis ou autenticação para recursos privados.

Devo adicionar uma linha de sitemap ao robots.txt?

Geralmente sim. Uma diretiva Sitemap: é uma forte dica operacional para rastreadores e um bom hábito para sites grandes, multilíngues ou atualizados com frequência. Use uma URL absoluta em vez de um caminho relativo para que o sinal seja inequívoco.

Por que o crawl-delay é sinalizado no relatório?

Crawl-delay não é suportado de forma consistente entre os principais mecanismos de busca. Alguns rastreadores podem reconhecê-lo, mas o Google não. A ferramenta o sinaliza para que você o trate como uma diretiva segmentada, e não como uma configuração universal de taxa de rastreamento.

Cite este conteúdo, página ou ferramenta como:

"Gerador de Robots.txt" em https://MiniWebtool.com/br/gerador-de-robotstxt/ de MiniWebtool, https://MiniWebtool.com/

pela equipe miniwebtool. Atualizado em: 09/03/2026

Outras ferramentas relacionadas:

Verificador de Idade de DomínioNovo

Gerador de Tags HreflangNovo

Gerador de Redirecionamento HtaccessNovo

Embelezador de HTMLNovo

Gerador de Meta Tag

Verificador de Open GraphNovo

Verificador de RedirecionamentoNovo

Gerador de Marcação SchemaNovo

Consulta WHOISNovo

Gerador de Sitemap XMLNovo

Gerador de Robots.txt

Escolha o fluxo de trabalho

Defina o contexto do site

Defina caminhos globais de permissão e bloqueio

Adicione sitemap e seções específicas de bots

Cole o arquivo que você deseja verificar

Gerador de Robots.txt

Como Usar

Estratégia de Diretivas e Erros Comuns

Casos de Uso Práticos

O que o Robots.txt Não Faz

FAQ

O que um arquivo robots.txt deve conter para um site público normal?

O robots.txt impede que uma página seja indexada?

Devo adicionar uma linha de sitemap ao robots.txt?

Por que o crawl-delay é sinalizado no relatório?

Outras ferramentas relacionadas:

Ferramentas de webmaster:

Ferramentas em destaque: