NUEVOYa está disponible la primera herramienta de auditoría de visibilidad en IA para Web3.Ejecutar auditoría gratuita →
Free tool · Catches deprecated user-agents · CDN-aware

Are you actually allowing the right AI bots? Most crypto sites are not.

Type your domain. We fetch your robots.txt, run a CDN override test and verdict 12 AI bots across training, search and user-fetch roles. Catches the gotchas: deprecated anthropic-ai blocks doing nothing, Cloudflare overriding your origin file, training-vs-search confusion.

12 AI bots testedCDN override detection~5 seconds end-to-end

Verificación gratis · Sin tarjeta · Sin registro · Funciona en cualquier dominio público

// What you get back

Una salida representativa para un protocolo DeFi

Estado por bot en roles de entrenamiento, búsqueda y user-fetch. Después un bloque robots.txt copy-paste afinado para AEO crypto.

Web3 robots.txt check · 12 AI bots tested · CDN scan complete
example-protocol.xyz
3/12

3 de 12 bots IA correctamente configurados · 4 problemas críticos

Faltan bots de búsqueda en tu allowlist. Dos strings de user-agent deprecados no hacen nada. Cloudflare está sirviendo un robots.txt distinto en el CDN. Cuatro problemas a tratar abajo, aproximadamente 10 minutos de ediciones.

AI bot matrix

User-agentOperatorRoleEstado
GPTBotOpenAIEntrenamiento● Blocked
OAI-BúsquedaBotOpenAIBúsqueda○ Implicit allow
ChatGPT-UserOpenAIUser-fetch○ Implicit allow
ClaudeBotAnthropicEntrenamiento● Blocked
Claude-BúsquedaBotAnthropicBúsqueda○ Implicit allow
Claude-UserAnthropicUser-fetch○ Implicit allow
anthropic-aiAnthropic (deprecated)Entrenamiento⊘ Deprecated · noop
Claude-WebAnthropic (deprecated)Entrenamiento⊘ Deprecated · noop
PerplexityBotPerplexityBúsqueda○ Implicit allow
Perplexity-UserPerplexityUser-fetch○ Implicit allow
CCBotCommon CrawlEntrenamiento● Blocked
Google-ExtendedGoogle AIEntrenamiento✓ Permitired

Top 4 issues to fix

  1. Búsqueda bots only implicitly allowed. OAI-BúsquedaBot, Claude-BúsquedaBot, PerplexityBot have no explicit Permitir rule. They fall back to the wildcard User-agent: * Permitir: /, but operators recommend explicit allowlist for clarity and to override CDN bot management defaults that block on no-rule. Corrección: add explicit Permitir blocks per the snippet below.
  2. Two deprecated user-agent strings (anthropic-ai, Claude-Web) doing nothing. Anthropic deprecated both. Your robots.txt has Disallow rules targeting them; the real ClaudeBot ignores those rules. Corrección: remove the deprecated entries (purely cosmetic, but the file is also misleading any human auditor reading it).
  3. Cloudflare is overriding your origin robots.txt. The CDN serves a different file to bot user-agents than to humans, with broader Disallow rules. This is the Cloudflare-managed AI crawler block enabled in Seguridad > Bots. Corrección: in Cloudflare dashboard, disable "Manage your robots.txt" so your origin file takes precedence, or move the AI bot rules into Cloudflare directly.
  4. No /admin/ or /internal/ Disallow rules. Best practice for crypto sites is selective access: allow /docs/, /blog/, /pricing/ but Disallow gated and admin areas. Yours has no Disallow on common gated paths. Corrección: add Disallow: /admin/, Disallow: /internal/, Disallow: /api-docs/private/.

Recommended robots.txt for crypto AEO

# ============================================================
# robots.txt for crypto AEO baseline
# Block AI training crawlers, allow AI search crawlers
# ============================================================

# --- AI search & user-fetch (allow for AEO visibility) ---
User-agent: OAI-BúsquedaBot
Permitir: /

User-agent: ChatGPT-User
Permitir: /

User-agent: Claude-BúsquedaBot
Permitir: /

User-agent: Claude-User
Permitir: /

User-agent: PerplexityBot
Permitir: /

User-agent: Perplexity-User
Permitir: /

# --- AI training bulk crawlers (block by default) ---
User-agent: GPTBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: Bytespider
Disallow: /

# --- Default policy + crypto-specific Disallow ---
User-agent: *
Permitir: /
Disallow: /admin/
Disallow: /internal/
Disallow: /api-docs/private/

Mapa del sitio: https://example-protocol.xyz/sitemap.xml

Want the full AEO readiness audit, not just robots.txt?

Robots.txt es una de cuatro dimensiones de readiness en visibilidad IA. La auditoría completa también cubre readiness de schema, densidad factual y señales de autoridad más 30+ prompts por categoría probados en los 3 LLMs. Desde $25 único por dominio.

See AI Visibility module

La salida de arriba es representativa. Las verificaciones reales devuelven el estado bot-por-bot real para el dominio que envías.

// How it works

Tres pasos, ~5 segundos end-to-end

Sin registro. Sin tarjeta de crédito. Solo un dominio y un botón.

01

Trae el archivo

La herramienta trae /robots.txt y una página de muestra. Ambos fetches ocurren con headers tipo bot para que podamos detectar overrides gestionados por Cloudflare a nivel CDN.

02

Parsea y veredicto

Cada bloque User-agent se parsea. Se aplican reglas de especificidad (paths más específicos tienen precedencia). Cada uno de los 12 bots IA se etiqueta Permitired, Blocked, Implicit o Deprecated.

03

Obtén snippet de corrección

Veredicto por bot, problemas top con razonamiento, más un bloque robots.txt copy-paste afinado para AEO crypto que puedes enviar en un commit.

// Three bot roles, three different decisions

"Bots IA" no es una sola cosa. Son tres.

Cada compañía de IA ejecuta user-agents separados para entrenamiento, búsqueda y user-fetch. Bloquear uno no tiene efecto en los otros.

● Entrenamiento

Scraping web masivo para entrenamiento de modelos

Rastrea la web abierta para recolectar data de entrenamiento. Bandwidth pesado. Sin tráfico de referencia de vuelta. Bloquea para proteger contenido de ser absorbido en datasets de entrenamiento.

GPTBotOpenAI
ClaudeBotAnthropic
CCBotCommon Crawl
Google-ExtendedGoogle AI

Common crypto stance

Block · No AI training

● Búsqueda

Indexación para respuestas de búsqueda IA

Impulsa respuestas en vivo dentro de ChatGPT, Claude y Perplexity. Genera tráfico de referencia que convierte 4.4x mejor que el orgánico estándar. Permitir para visibilidad AEO.

OAI-BúsquedaBotOpenAI
Claude-BúsquedaBotAnthropic
PerplexityBotPerplexity

Common crypto stance

Permitir · Stay visible

● User-fetch

Recuperación de página on-demand

Trae una página específica cuando un usuario le pregunta a la IA algo que necesita data fresca. Tráfico de alta intención. Permitir para que los usuarios obtengan respuestas precisas y actuales sobre tu protocolo.

ChatGPT-UserOpenAI
Claude-UserAnthropic
Perplexity-UserPerplexity

Common crypto stance

Permitir · Stay visible

27%

de sitios B2B accidentalmente bloquean crawlers LLM vía reglas a nivel CDN

Mersel · ziptie

69%

de crawlers IA no pueden ejecutar JavaScript en sitios SPA

Vercel · MERJ

4.4x

lift de conversión en tráfico referido por IA vs búsqueda orgánica estándar

Superlines aggregated
// Web3 robots.txt Preguntas frecuentes

Preguntas comunes sobre allowlisting de bots IA

If you have a question not answered here, the full AI Visibility audit module page goes deeper.

¿Cuál es la diferencia entre crawlers de entrenamiento y crawlers de búsqueda?

Misma compañía, distintos bots, distintos trabajos. Bloquear uno no tiene efecto en el otro. El error más común es tratarlos como la misma cosa.

Entrenamiento

Scraping masivo para entrenamiento de modelos. Postura común: bloquear.

Búsqueda

Impulsa respuestas de búsqueda IA. Postura común: permitir.

¿anthropic-ai y Claude-Web siguen siendo user-agents válidos?

No. Anthropic deprecó ambos. Las reglas de robots.txt apuntando solo a estos strings no hacen nada. Los user-agents activos de Anthropic son:

anthropic-aiClaude-WebClaudeBotClaude-BúsquedaBotClaude-User
¿Por qué mi robots.txt se ve correcto pero los bots siguen bloqueados?

Cloudflare y otros CDNs comúnmente sobrescriben tu archivo de origen con sus propias reglas de bots IA. La corrección está en el dashboard del CDN, no en el archivo de origen.

27%
de sitios SaaS B2B y ecommerce accidentalmente bloquean crawlers LLM importantes vía reglas a nivel CDN. Mersel · ziptie research
¿Qué debe permitir vs bloquear un sitio crypto?

Acceso selectivo es el default recomendado. Bloquea bots de entrenamiento, permite bots de búsqueda y user-fetch, Disallow paths cerrados.

Permitir

/docs/, /blog/, /pricing/, explainers de protocolo

Disallow

/admin/, /internal/, áreas de comunidad cerradas

¿Bloquear GPTBot afecta el ranking de Google?

No. Googlebot maneja búsqueda; Google-Extended maneja entrenamiento IA. Bloquea bots IA sin afectar la búsqueda de Google.

Googlebot

Rankings de búsqueda · independiente

Google-Extended

Entrenamiento IA · seguro de bloquear

¿Por qué el renderizado JavaScript es relevante para robots.txt?

Robots.txt puede correctamente permitir GPTBot, pero el bot sigue viendo una página en blanco en sitios SPA. Corrección: prerendering server-side o estático.

69%
de crawlers IA no pueden ejecutar JavaScript. Los sitios crypto construidos en SPA envían HTML vacío a la mayoría de bots IA. Vercel · MERJ research
¿Cuál es el lift de conversión del tráfico referido por IA?

Los usuarios referidos por IA llegan con mayor intención. Ya leyeron la explicación de la IA sobre tu protocolo antes de hacer clic.

4.4x
lift de conversión en tráfico referido por IA versus búsqueda orgánica estándar. Superlines aggregated data
¿Con qué frecuencia debo verificar de nuevo la configuración de robots.txt?

Trimestralmente es suficiente. Vuelve a verificar antes después de migración de CDN, cambio de host o rebuild mayor del sitio. Nuevos strings de user-agent IA aparecen regularmente.

Cadencia trimestralDespués de swap de CDNDespués de rebuild del sitioSi AEO baja

Rastrea la tasa de citas con el verificador de citas IA para detectar regresiones.

Robots.txt es una pieza. ¿Quieres la imagen completa de readiness AEO?

robots.txt es una señal. Crawlux es nuestra herramienta de auditoría gratis que escanea tu dominio completo y te da un informe completo sobre lo que los bots IA realmente encuentran: schema, profundidad de contenido, estructura Preguntas frecuentes y 5 áreas más. Tarda alrededor de 4 minutos. Sin registro, sin tarjeta de crédito.

Free tier · Sin tarjeta de crédito · One-time pricing on paid tiers