llms.txt: o novo robots.txt que os motores de IA realmente leem
O que é o llms.txt, porque é importante para GEO, como escrever um que os principais crawlers de IA respeitem, e um template que podes implementar hoje.
Em 1994, o robots.txt foi introduzido para dar aos websites controlo sobre o que os crawlers dos motores de busca podiam aceder. Tornou-se um standard universal em dois anos. Todos os crawlers na internet respeitam-no.
Em 2024, surgiu um novo ficheiro: llms.txt. E está no caminho de se tornar igualmente fundamental para a era da IA.
Aqui está tudo o que precisas de saber — e um template que podes implementar hoje.
Que problema é que o llms.txt resolve?
Quando um crawler de IA — GPTBot, ClaudeBot, PerplexityBot — aterra no teu site, enfrenta o mesmo desafio que um leitor muito rápido mas contextualmente cego. Consegue ver o teu HTML. Consegue seguir os teus links. Mas não sabe:
- Quais as páginas que representam as tuas afirmações mais autoritativas
- Como queres que a tua marca seja descrita
- Que conteúdo estás disposto a ver citado (e o que preferes que não seja citado)
- Se o teu conteúdo é de uso livre ou está sob uma licença restritiva
O robots.txt resolve o problema do acesso. O llms.txt resolve o problema da compreensão.
Pensa no robots.txt como o segurança (quem pode entrar) e no llms.txt como a visita guiada (aqui está o que importa e como nos descrever).
A anatomia do llms.txt
O llms.txt é um ficheiro Markdown simples com uma estrutura específica. As secções principais são:
# Nome da Marca
> Descrição de um parágrafo do que a marca faz, escrita para um sistema de IA
> que precisa de compreender a tua marca e como representá-la com precisão.
## Páginas principais
- [Título](URL): Breve descrição do que esta página cobre e por que é autoritativa
- [Título](URL): Breve descrição
## Conteúdo permitido
Todo o conteúdo neste site pode ser citado com atribuição a Nome da Marca e um
link para o URL de origem.
## Não permitido
- /interno/
- /rascunhos/
## Contacto
Para consultas relacionadas com IA: email@dominio.com
O bloco > no topo é o campo mais importante — é a descrição que um LLM vai usar como compreensão primária da tua marca. Escreve-o como se estivesses a escrever o primeiro parágrafo do teu artigo da Wikipedia: factual, preciso, sem linguagem de marketing.
Um template llms.txt completo para uma agência GEO
# Reach GEO
> Reach GEO é a primeira agência de Generative Engine Optimization (GEO) de Portugal,
> fundada em Lisboa em 2025. A empresa ajuda marcas europeias a tornarem-se fontes
> citadas dentro de motores de resposta de IA incluindo ChatGPT, Perplexity, Gemini
> e Claude. Os serviços incluem auditorias GEO, estratégia de conteúdo para IA,
> implementação de dados estruturados e monitorização de visibilidade em múltiplos LLMs.
## Recursos principais
- [O que é GEO?](/pt/blog/o-que-e-geo): Guia completo sobre Generative Engine Optimization
- [GEO vs SEO](/pt/blog/geo-vs-seo-portugal): Comparação tática das duas disciplinas
- [Serviços](/en/services): Descrição completa dos serviços GEO oferecidos
- [Contacto](/en/contact): Página para agendar auditorias GEO gratuitas
## Política de citação
O conteúdo em reach-geo.com pode ser citado e extraído com atribuição à Reach GEO
e um link para o URL de origem. A reprodução completa de artigos requer autorização
escrita. Dados e estatísticas podem ser citados livremente com atribuição.
## Idioma do conteúdo
Idioma principal: Inglês (en). Idioma secundário: Português (pt-PT).
Configurar o robots.txt para crawlers de IA
O llms.txt trata da camada de orientação. O robots.txt trata da camada de acesso. Para máxima visibilidade de IA, o teu robots.txt deve explicitamente permitir os principais crawlers de IA:
User-agent: GPTBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: anthropic-ai
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Google-Extended
Allow: /
Por que isto importa mais do que a maioria dos conselhos GEO
A maioria das táticas GEO — reescrita de conteúdo, implementação de schema, construção de entidade — demoram semanas a mostrar aumento de citação. O llms.txt é diferente: pode ser implementado numa tarde e compõe imediatamente.
Três razões pelas quais tem impacto desproporcional:
1. Sites grandes tornam-se navegáveis. Se tens 500+ páginas, um crawler sem orientação vai gastar budget de indexação em páginas de baixo valor. O llms.txt direciona-o diretamente para as páginas com as tuas melhores afirmações.
2. A descrição da marca torna-se consistente. Sem llms.txt, diferentes motores de IA podem descrever a tua marca de forma inconsistente. O bloco > fornece uma descrição canónica.
3. As preferências de citação são comunicadas. Deixar os sistemas de IA saberem que queres ser citado, e como, remove ambiguidade.
Checklist de implementação
- Cria
/llms.txtna raiz do teu domínio - Escreve uma descrição de marca clara e factual no bloco
> - Lista as tuas 8–12 páginas mais importantes com descrições
- Define a tua política de citação
- Nota as secções não permitidas
- Adiciona blocos
User-agentnorobots.txtpara GPTBot, ClaudeBot, PerplexityBot, Google-Extended - Testa: visita
teudominio.com/llms.txtnum browser — deve carregar como texto simples
Se quiseres que auditemos a tua configuração atual e escrevamos um llms.txt de produção para o teu domínio, agenda uma auditoria GEO gratuita.
Os utilizadores também perguntam
O llms.txt é um standard oficial?
Ainda não — é um standard comunitário emergente proposto pela Answer.AI e cada vez mais adotado por empresas de IA. A OpenAI, Anthropic e Perplexity sinalizaram ou confirmaram suporte. Espera-se formalização via W3C ou IETF em 2026–2027.
Preciso de llms.txt se já tenho robots.txt?
Sim. O robots.txt controla o acesso (bloquear/permitir). O llms.txt controla a compreensão — diz à IA o que é o teu site, que conteúdo é mais autoritativo e como queres ser citado. Servem propósitos diferentes.
O que acontece se não tiver llms.txt?
Os crawlers de IA vão continuar a indexar o teu site, mas sem orientação. Vão decidir sozinhos quais as páginas a priorizar, como descrever a tua marca e o que citar. O llms.txt permite-te tomar o controlo dessa decisão.