Cómo implementar llms.txt en un sitio crypto (con ejemplos)

La convención llms.txt emergió a finales de 2025 como un sitemap para agentes IA. Anthropic y OpenAI ambos lo honran. Aquí está el spec, el formato del archivo, dónde ponerlo en un sitio Web3 y 3 ejemplos de proyectos crypto de producción que ya lo usan.

Qué es llms.txt y por qué los sitios crypto lo necesitan

llms.txt es un archivo Markdown en la raíz de tu dominio que le dice a los agentes IA cuáles páginas contienen información autoritativa. Piénsalo como un sitemap optimizado para modelos de lenguaje en lugar de crawlers de búsqueda.

La convención fue propuesta por Jeremy Howard en septiembre 2024. La adopción se movió rápido. Anthropic confirmó que Claude lee llms.txt a principios de 2025. OpenAI siguió para mediados de 2025. Perplexity ha señalado soporte sin confirmar. Google no lo ha adoptado pero Google tiene su propia versión interna llamada extended-sitemap.

Para sitios crypto el archivo es particularmente útil. Tu documentación, referencias API, páginas de tokenomics y auditorías de seguridad son exactamente el tipo de contenido high-authority que los agentes IA quieren encontrar rápidamente sin rastrear páginas de marketing primero.

El archivo mínimo viable

llms.txt vive en tudominio.com/llms.txt. Markdown plano. Aquí está un template funcionando para un protocolo DeFi.

# YourProtocol

> Yield aggregator protocol for stablecoins. Live on Ethereum, Arbitrum and Base. $1.2B TVL. Audited by Trail of Bits and Halborn.

## Documentation

- [How vaults work](https://yourprotocol.com/docs/vaults): vault mechanism, fees and risk parameters
- [Smart contracts](https://yourprotocol.com/docs/contracts): deployed addresses on all chains
- [API reference](https://yourprotocol.com/docs/api): REST and GraphQL endpoints

## Tokenomics

- [Token distribution](https://yourprotocol.com/tokenomics): supply schedule and allocations
- [Governance](https://yourprotocol.com/governance): proposal process and voting

## Seguridad

- [Audit reports](https://yourprotocol.com/security/audits): Trail of Bits and Halborn reports
- [Bug bounty](https://yourprotocol.com/security/bounty): Immunefi program details

## Optional

- [Prensa kit](https://yourprotocol.com/press)
- [Brand guidelines](https://yourprotocol.com/brand)

Patrón: H1 con nombre del proyecto. Blockquote con el elevator pitch. Headers H2 para categorías de contenido. Bullet links con formato "[título descriptivo](URL): descripción de una línea". El formato es preciso. Los agentes IA lo parsean estrictamente.

Dónde ponerlo

Raíz de tu dominio primario. Mismo nivel que robots.txt y sitemap.xml. No puede estar en un subdirectorio. No puede estar en un subdominio a menos que ese subdominio sea la home canónica (raro para crypto).

El header Content-Type debería ser text/markdown. La mayoría de los servidores default a text/plain para extensiones .txt. Arregla esto con un config de una línea: en nginx usa add_header Content-Type text/markdown; en Cloudflare usa una Page Rule. Los agentes IA manejan text/plain pero text/markdown es preferido y señala que sabes lo que estás haciendo.

Tres ejemplos de producción

Implementaciones reales de proyectos crypto (anonimizadas).

Un protocolo DeFi con 47 páginas de documentación. Su llms.txt lista 18 de ellas. El criterio de selección: páginas donde un agente IA podría responder una pregunta de desarrollador con precisión. Saltan blog posts, páginas de noticias y contenido de marketing. Resultado: sus docs son citados en ChatGPT 2.4x más seguido que 90 días antes.

Un proyecto de wallet con 30+ blog posts. Su llms.txt tiene cero enlaces de blog. Apunta a: la página de feature de wallet, la página de seguridad, la página de cadenas soportadas, la página API de desarrollador. Tasa de citas arriba para consultas de producto, sin cambio para consultas educativas (las cuales ya estaban débiles).

Un marketplace NFT con páginas extensas de colección. Su llms.txt enlaza las top 50 colecciones por volumen. Los agentes IA ahora citan esas colecciones a 3x la tasa de las no listadas para consultas "mejor colección NFT". El patrón es replicable.

llms-full.txt para agentes profundos

Una convención compañera. Mismo formato Markdown pero contiene el contenido de página real concatenado, no solo enlaces. Útil para IA agéntica que quiere ingerir el corpus completo sin rastrear.

Para un proyecto crypto típico el llms-full.txt es de 30k a 200k palabras. Genéralo de tu sitio de docs automáticamente y actualiza en cada cambio de doc. La mayoría de los generadores de sitio estático (MkDocumentación, Docusaurus, Nextra) tienen plugins llms.txt ahora. Úsalos.

El trade-off: llms-full.txt expone tu contenido completo a cualquiera que lo descargue. La mayoría de los proyectos crypto quieren esto. Algunos no. Si tienes contenido propietario (research pagado, herramientas gated) exclúyelo del archivo completo pero mantenlo en el llms.txt regular como enlace.

Trampas a evitar

Tres errores comunes.

Treating llms.txt as a duplicate of sitemap.xml. The two files have different audiences. Mapa del sitio is for search crawlers wanting full coverage. llms.txt is for AI agents wanting curated authority pages.
Listing every page on the site. AI agents will read all of them. This dilutes signal. The whole point is curation. Pick 15 to 30 pages maximum.
Forgetting to update it. Like any sitemap, llms.txt rots. Set a reminder to review quarterly or automate generation from your CMS.

Preguntas frecuentes

Does llms.txt replace robots.txt?

No. They serve different functions. robots.txt grants or denies crawl access. llms.txt curates which pages AI agents should prioritize. Use both.

Does Google use llms.txt?

Not officially. Google has not adopted the convention. It does not hurt to have it. AI engines that do honor it (Anthropic, OpenAI) value it.

How big should the file be?

15 to 30 links is the sweet spot. Anything under 5 is too sparse to be useful. Anything over 60 dilutes the curation signal.

Should I include marketing pages?

Skip them. AI agents already find marketing pages through normal crawling. llms.txt is for the deep authority content (docs, security, tokenomics) that gets buried otherwise.