Concepto de marketing digital e inteligencia artificial: el archivo llms.txt que enseña a ChatGPT, Claude y Perplexity a hablar de tu marca

llms.txt: el archivo que enseña a ChatGPT, Claude y Perplexity a hablar de tu marca

Hay una conversación incómoda que estamos teniendo casi a diario con clientes desde principios de año. La pregunta llega con palabras distintas pero el fondo es siempre el mismo: “¿qué hago para que ChatGPT cuente bien lo que hacemos cuando alguien pregunta por nosotros?”. Es una pregunta razonable. En enero de 2026, según Searchlab, Google AI Mode superó los 75 millones de usuarios diarios y los AI Overviews aparecían en el 48% de las búsquedas, con caídas de CTR que rondan el 60-65% cuando tu sitio no es la fuente citada. El SEO clásico no ha muerto, pero ahora compite con un capítulo nuevo: aparecer dentro de la respuesta, no debajo.

En ese contexto, un archivo pequeñito de texto plano se ha colado en cada conversación de marketing técnico: llms.txt. Y como pasa siempre con cualquier estándar que promete “hablar con la IA”, hay mucho ruido alrededor. Vamos por partes, sin trampa.

Qué es exactamente llms.txt

llms.txt es una propuesta de estándar publicada por Jeremy Howard a finales de 2024, alojada en llmstxt.org. La idea es simple y elegante: un archivo en formato Markdown, colocado en la raíz de tu dominio (https://tudominio.com/llms.txt), que resume lo esencial de tu sitio en un lenguaje que un modelo grande de lenguaje puede leer en pocos tokens.

A diferencia de robots.txt, que indica a los crawlers qué pueden o no rastrear, llms.txt cumple otra función: ofrece a la IA un resumen curado de tu sitio y enlaces a las páginas que tú consideras canónicas para entender tu marca. No es un permiso ni un bloqueo. Es un mapa.

El formato es deliberadamente austero. Un encabezado H1 con el nombre del sitio, una cita destacada (blockquote) con la descripción más importante —esa frase es, en la práctica, el resumen que un modelo puede parafrasear cuando alguien le pregunte qué es tu empresa— y, debajo, secciones temáticas con enlaces a recursos. Servicios, casos de éxito, documentación, política de precios. Lo que tú decidas exponer.

Cómo está la adopción real en mayo de 2026

Hasta aquí la teoría, que es preciosa. Lo que pasa en la práctica es más matizado y conviene contarlo sin maquillaje.

Un análisis publicado por Search Engine Journal sobre unos 300.000 dominios encontró que apenas el 10,13% había publicado un llms.txt. El mismo estudio no detectó un efecto claro sobre la frecuencia con la que esos sitios aparecían citados en respuestas de IA. Hay analistas, como Kai Spriestersbach, que directamente han escrito que el estándar es un fiasco, apuntando a que ni OpenAI, ni Google ni Anthropic solicitan ese archivo de forma sistemática. GPTBot lo pide ocasionalmente. Los IDE agents tipo Cursor o Continue sí lo usan con cierta consistencia.

Y sin embargo, las marcas serias del sector lo han implementado. Anthropic, Hugging Face, Perplexity, Vercel, Stripe y Mintlify tienen llms.txt publicado en sus dominios. La razón es coherente con lo que vemos en cualquier estándar emergente: el coste de tener uno es cercano a cero, el coste de no tenerlo cuando el ecosistema termine consolidándose puede no serlo tanto.

Así que la lectura honesta a fecha de mayo de 2026 es esta: llms.txt no es, por sí solo, un atajo para ser citado por ChatGPT. Pero es la primera convención estandarizada de lo que ya estamos llamando B2A (Business-to-Agent). Es decir, una superficie pública pensada para que agentes —no humanos— entiendan tu marca sin tener que digerir tu home, tu menú y tres dropdowns animados.

Por qué los modelos no siempre lo leen (y por qué hacerlo igualmente)

Para entender por qué tiene sentido invertir tiempo en un archivo cuyo impacto inmediato es incierto hay que mirar dos vectores.

El primero es el comportamiento real de los crawlers. Hoy la mayor parte del entrenamiento de los grandes modelos —y de los datos que recuperan en caliente al responder— se obtiene de tu sitio normal: HTML público, sitemap, structured data y, cada vez más, feeds que las propias compañías (Reddit, Wikipedia, medios) negocian directamente. El llms.txt no sustituye nada de eso. Lo complementa.

El segundo es el momento en que los agentes empiezan a navegar por ti. Y eso ya está pasando. Comet de Perplexity, ChatGPT Atlas y los modos agentic de Claude visitan páginas, leen, deciden. En ese flujo, encontrar un archivo corto en Markdown con la descripción clara de qué eres y los enlaces a lo importante es objetivamente útil para el modelo. No te garantiza una recomendación; reduce la fricción para que pueda darla.

Como decimos en Vandelay cuando un cliente nos pregunta si tiene sentido: es como tener una buena ficha de Google Business. Nadie te asegura que vayas a salir el primero, pero salir sin ella es jugarse el partido descalzo.

Cómo se construye un llms.txt útil

Lo decisivo no es la longitud, es lo que pones. Estos son los bloques que recomendamos a nuestros clientes, en orden de prioridad.

1. Una sola frase fundacional

La que va en el blockquote bajo el H1. Esta frase es la que el modelo va a parafrasear si alguien le pregunta “¿qué es esta empresa?”. Si en tu home pone “soluciones integrales para tu transformación”, reescríbela. Necesitas algo verificable, específico y compacto. Por ejemplo, en lugar de “agencia de marketing digital en Barcelona”, algo como “agencia de marketing digital en Barcelona especializada en campañas de Meta Ads, Google Ads y SEO para empresas B2B de servicios profesionales, con más de diez años en el sector”.

2. Secciones temáticas con enlaces canónicos

Servicios, casos de éxito, equipo, política editorial. Una sección por tema, con dos o tres enlaces como máximo en cada una. Cada enlace acompañado de una descripción de una línea explicando qué encontrará el modelo si lo sigue. Cuanto más claro y menos lírico, mejor.

3. Una sección Optional al final

Pensada para material secundario: blog, glosarios, documentación interna. Permite que un agente con tiempo y tokens pueda profundizar, sin saturar la lectura principal del archivo.

4. Cero lenguaje publicitario hueco

Los modelos parafrasean. Si tu llms.txt está lleno de “líderes en innovación” y “soluciones disruptivas”, eso es lo que aparecerá en la respuesta que el cliente final lea. Y eso es justo lo que no quieres.

Errores que te pueden costar visibilidad

Los hemos visto en auditorías recientes y todos son evitables:

  • Bloquear los bots de IA en robots.txt mientras presumes de tener llms.txt. Es la incoherencia clásica. Si has decidido aparecer en respuestas, deja pasar a GPTBot, ChatGPT-User, PerplexityBot, ClaudeBot y anthropic-ai.
  • Servir el archivo con el MIME type equivocado. Algunos servidores devuelven application/octet-stream por defecto para .txt. Conviene servirlo como text/plain; charset=utf-8 y, ya que estamos, comprobar que devuelve un HTTP 200 limpio, sin redirecciones de por medio.
  • Enlazar páginas que requieren login o que cambian de URL cada poco tiempo. El modelo seguirá esos enlaces y, si encuentra 404 o paredes de pago, simplemente desistirá.
  • Olvidar mantenerlo. Un llms.txt desactualizado es peor que no tenerlo. Si en él pone que vendes ocho servicios y en la web solo ofreces cinco, la respuesta que dará la IA será contradictoria con tu propio sitio.

Lo que cambia en tu trabajo el día que lo subes

Lo más interesante de todo este ejercicio no es el archivo en sí, sino lo que te obliga a hacer para escribirlo bien. La mayoría de empresas con las que trabajamos descubren, redactando su llms.txt, que no son capaces de explicar en una sola frase qué hacen exactamente. O que tienen tres páginas distintas describiendo el mismo servicio con palabras diferentes. O que la sección de “casos de éxito” lleva tres años sin actualizar.

Ese inventario forzado es, en sí mismo, el principal entregable. El archivo lo sube tu desarrollador en cinco minutos. La conversación previa —qué somos, qué hacemos, qué queremos que la IA repita sobre nosotros— es la que vale el ejercicio entero.

Si quieres revisar si tu sitio está preparado para esta capa nueva de visibilidad, en Vandelay incluimos la auditoría de llms.txt y el ajuste de tu superficie B2A dentro de nuestro servicio de SEO técnico. Y si solo quieres ver cómo está respondiendo hoy ChatGPT cuando alguien pregunta por tu marca, también lo hacemos: en quince minutos de trabajo se ve si tienes un problema o no.

es_ESEspañol