Marketing · IA · Mayo 2026 · Lectura ~18 min

El 60 % de las búsquedas de Google ya terminan sin clic, y los chats de IA (ChatGPT, Claude, Perplexity, Gemini, Copilot) absorben cada mes más consultas informacionales que SERPs tradicionales. GEO — Generative Engine Optimization es la disciplina que hace que tu contenido aparezca dentro de las respuestas de esos motores generativos, no debajo. Esta guía resume cómo orientar tu sitio a ese nuevo canal en 2026 sin tirar lo aprendido en SEO clásico: aprovecha lo que ya funciona (E-E-A-T, schema, autoridad temática) y suma lo nuevo (llms.txt, citation-worthy passages, FAQPage, Speakable, control de crawlers de OpenAI, Anthropic y Perplexity).

Qué es GEO y por qué importa en 2026

GEO — Generative Engine Optimization — es la práctica de ajustar contenido, datos estructurados y permisos de crawling para maximizar la probabilidad de que un motor generativo (ChatGPT con búsqueda web, Claude con web search, Perplexity, Gemini, Copilot) cite tu sitio dentro de la respuesta que devuelve al usuario. El término empezó a circular en 2023-2024 con papers académicos como GEO: Generative Engine Optimization (Aggarwal et al., Princeton) y se consolidó en 2025-2026 como categoría profesional.

La fricción es real. Pew Research midió en 2024 que el 26 % de los usuarios estadounidenses adultos había usado un chatbot de IA para buscar información, y SimilarWeb reportó que ChatGPT pasó de 100 millones de usuarios mensuales en enero 2023 a más de 800 millones en 2025. Cuando un usuario pregunta a Claude “qué es el AI Act” o a Perplexity “mejor CRM para pymes”, la respuesta es una síntesis con citas — y solo aparecen los sitios que el LLM ha podido leer, ha juzgado autorizados y tiene permiso explícito de citar.

Diferencias con SEO clásico

EjeSEO clásicoGEO
ObjetivoAparecer en SERPAparecer dentro de la respuesta del LLM
Unidad de relevanciaURL / páginaPasaje / párrafo citable
Señal de autoridadBacklinks, E-E-A-TBacklinks + mención sin enlace + datos verificables
Control de accesorobots.txt Googlebot/Bingbotrobots.txt + llms.txt + cabeceras
MétricaPosición media, CTR, impresiones GSCShare of voice en LLMs, citas por consulta, tráfico referrer chatgpt.com/perplexity.ai
Latencia de impacto2-12 semanasHoras a días (refresco continuo del índice del LLM)

GEO no reemplaza al SEO: lo extiende. Lo que ya tienes bien posicionado en Google con E-E-A-T fuerte es candidato natural a ser citado por LLMs. Lo que tienes posicionado con artificios SEO obsoletos (keyword stuffing, contenido fino, schema falso) no convencerá a ningún motor generativo porque su criterio de cita es más cercano al de un editor que al de un crawler.

Por qué cambia la economía del tráfico

El cambio relevante no es técnico sino económico. Cuando Google contesta directamente con AI Overviews, el clic se evapora — Pew Research midió en julio 2025 que las búsquedas con AI Overview reciben aproximadamente la mitad de clics que las búsquedas equivalentes sin AI Overview. SimilarWeb confirmó caídas de tráfico orgánico de doble dígito en sitios de viajes, salud y educación durante 2024-2025. Esa pérdida no es reversible con SEO clásico porque no hay SERP que mejorar: el usuario nunca llega a ver enlaces.

La consecuencia operativa es que un sitio B2B en 2026 necesita dos canales de visibilidad orgánica vivos:

Renunciar al segundo canal es regalar branding a la competencia que sí ha invertido en GEO. Es la misma decisión estratégica que las marcas tomaron entre 2008-2012 al aceptar invertir en social media: ese canal generaba poco tráfico medible pero mucho recuerdo de marca.

Crawlers LLM: cómo te ven OpenAI, Anthropic, Perplexity y Google

Antes de optimizar, hay que entender qué bots existen, qué hacen y cómo permitirlos o bloquearlos. Cada proveedor publica su user agent y su comportamiento en robots.txt.

OpenAI

Anthropic

Perplexity

Google y Microsoft

Política recomendada para una marca B2B

BotPermitirRazón
OAI-SearchBotAparecer en ChatGPT Search
GPTBotSí (si te interesa estar en modelos futuros)Refuerza E-E-A-T en el modelo base
ClaudeBotCitas en Claude
Claude-Web / Claude-UserFetch en vivo
PerplexityBotCitas en Perplexity
Google-ExtendedCitas en Gemini / AI Overviews
BingbotCopilot y Bing tradicional

Para un sitio editorial que vende suscripciones o licencias, la política puede invertirse: bloquear GPTBot y ClaudeBot (entrenamiento) pero permitir OAI-SearchBot, Claude-Web y PerplexityBot (búsqueda en vivo, que sí genera tráfico referrer). Esta es la postura que adoptaron en 2024-2025 The New York Times, Reuters y Axel Springer.

El estándar llms.txt en 2026

llms.txt es una propuesta de Jeremy Howard (Answer.AI) publicada en septiembre 2024 que estandariza un archivo markdown en la raíz del dominio para guiar a LLMs hacia las páginas canónicas del sitio. No reemplaza a robots.txt ni a sitemap.xml: los complementa.

Anatomía mínima

El archivo vive en https://tu-dominio.com/llms.txt y tiene esta forma:

# Nombre del sitio

> Descripción de una línea del propósito del sitio.

Más contexto opcional en uno o dos párrafos.

## Páginas clave

- [Inicio](https://tu-dominio.com/): qué es el sitio.
- [Sobre mí](https://tu-dominio.com/sobre-mi/): biografía y trayectoria.
- [Servicios](https://tu-dominio.com/servicios/): qué ofreces.

## Pillars

- [Cumplimiento](https://tu-dominio.com/cumplimiento/): hub de ISO, ENS, RGPD.
- [Marketing](https://tu-dominio.com/marketing/): hub de branded content, neuromarketing.

## Opcional

- [Blog](https://tu-dominio.com/blog/): últimos artículos.

La versión extendida llms-full.txt incluye el contenido completo de cada página clave en markdown, de manera que un LLM pueda procesar todo el sitio en una sola petición sin necesidad de seguir enlaces. Útil para documentación técnica (Anthropic publica docs.anthropic.com/llms.txt, Vercel sdk.vercel.ai/llms.txt, Cursor docs.cursor.com/llms.txt).

Buenas prácticas en 2026

  1. Cura el listado: solo páginas canónicas (no etiquetas, archivos, paginaciones, parámetros).
  2. Coincide con tu arquitectura de silos: el hub de cada vertical aparece primero, luego sus pillars, luego artículos satélite si quieres exponer alguno emblemático.
  3. No dupliques sitemap.xml: llms.txt es selectivo. Si listas 4 000 URLs lo conviertes en ruido.
  4. Mantenlo: revísalo trimestralmente. Si una página deja de ser canónica, sácala.

Schema y datos estructurados para LLMs

Los LLMs con búsqueda en vivo no “razonan” sobre HTML: extraen información mediante embedding y parsing. Schema.org sigue siendo la guía más fiable porque normaliza entidades (Person, Organization, Article, FAQPage, Product, LocalBusiness) que el LLM puede mapear a su grafo interno.

Tipos imprescindibles para una marca de consultoría B2B

Speakable: la señal infravalorada

SpeakableSpecification indica qué secciones del HTML están redactadas para ser leídas en voz alta (Google Assistant, asistentes en vivo). En 2026 los LLMs lo usan como pista de que ese pasaje es auto-suficiente y por tanto buen candidato a cita. Implementación:

{
  "@context": "https://schema.org",
  "@type": "Article",
  "speakable": {
    "@type": "SpeakableSpecification",
    "cssSelector": [".aoc-tldr", "h2 + p"]
  }
}

Passage indexing y contenido citable

El passage indexing de Google (anunciado en 2020 y desplegado en 2021) cambió la unidad de relevancia: el motor puede rankear un pasaje concreto dentro de un artículo largo, no solo la URL como conjunto. Los LLMs con búsqueda heredaron esta lógica: si tu H2 “Qué es el AI Act” responde en el primer párrafo con una definición autosuficiente, ese pasaje aparece citado en la respuesta de Claude o Perplexity sin que el LLM lea el artículo completo.

Receta de pasaje citable

  1. H2 con pregunta natural: usa la forma exacta en que un humano lo preguntaría. “Qué es”, “Cómo se calcula”, “Cuánto cuesta”, “Cuándo se aplica”.
  2. Primer párrafo = respuesta directa: 40-80 palabras. Define o cuantifica de forma autosuficiente. Sin “a continuación veremos”.
  3. Cifra con fuente: cuando puedas, incluye un número con cita a la fuente oficial (BOE, EUR-Lex, Eurostat, ENISA, OpenAI docs, Anthropic docs).
  4. Anchor estable: id="que-es-ai-act" en el H2 para que el LLM pueda enlazar al pasaje exacto.
  5. Negativos visibles: si la respuesta tiene matices (“solo aplica a sistemas de alto riesgo”), dilos en el primer párrafo. El LLM no va a ir a buscar el matiz al final del artículo.

FAQPage y respuestas en cero clics

El bloque FAQ al final del artículo no es un adorno: es el formato más citado por motores generativos porque ya viene en formato pregunta-respuesta normalizado. Algunas reglas que aprendí redactando este sitio:

  1. 5-7 preguntas máximo por artículo. Más se diluye.
  2. Pregunta real, no marketing. La gente busca “cuánto cuesta certificarse en ISO 27001”, no “cómo optimizar tu inversión en ciberseguridad”.
  3. Respuesta de 60-100 palabras autosuficiente, con cifra o fecha si es posible.
  4. Schema FAQPage con mainEntity array de Question con acceptedAnswer.text.
  5. Coincidir con el cuerpo: las mismas preguntas como H2 en el artículo. Evita duplicación textual exacta: que sean variantes redactadas.

Anclas, identificadores y fragmentos enlazables

Los LLMs con búsqueda en vivo aprendieron en 2024-2025 a usar text fragments (la sintaxis #:~:text= que estandarizó Chrome) y anclas tradicionales (#id) para enlazar al pasaje exacto que están citando. Eso significa que tus anchors no son decorativos: son la unidad mínima que el motor puede compartir con el usuario final.

Tres prácticas que han demostrado mover share of voice en GEO:

  1. Anchor descriptivo en cada H2 y H3. Slug en kebab-case que refleje la pregunta o el concepto, no seccion-3. Si rediseñas, mantén los anchors antiguos como aliases.
  2. Una sola idea por H3. Si un H3 contiene dos definiciones, divídelo. El LLM citará la primera y dejará fuera la segunda.
  3. Tablas con thead. Las tablas <table> con <thead> y <tbody> son extraídas íntegras por Perplexity y citadas en forma de tabla en la respuesta. Tablas sin head se ignoran o se mal-parsean.

Frescura y mantenimiento

El último parámetro que los LLMs ponderan es la frescura. Una página con dateModified de hace 18 meses pierde peso frente a otra equivalente publicada el mes pasado. No se trata de cambiar la fecha sin tocar nada (los motores detectan la falsificación: comparan delta de texto), sino de mantener el contenido al día: añadir cifras nuevas, aclarar matices regulatorios, actualizar ejemplos. En este sitio mantenemos un calendario trimestral de revisión por silo.

Cómo medir tu visibilidad en motores generativos

El problema operativo del GEO es que Google Search Console no mide aparición en ChatGPT, Claude o Perplexity. Las métricas disponibles en 2026 son:

1. Tráfico referrer

En GA4 filtra session_source por chatgpt.com, perplexity.ai, claude.ai, copilot.microsoft.com, gemini.google.com. Mide impresiones reales generadas por citas con enlace clicado. Es el indicador más limpio pero infravalora: muchas respuestas no llevan a clic.

2. Brand monitoring en LLMs

Plataformas especializadas (Profound, Otterly, Peec.ai, AthenaHQ, Goodie AI, Daydream) lanzan miles de prompts en paralelo contra ChatGPT, Claude, Perplexity, Gemini, Copilot, miden share of voice de tu marca vs competidores, detectan tono y precisión de cita.

3. Mención en respuestas (zero-click)

Aunque no genere clic, ser citado tiene valor de marca. Mide manualmente: lanza 20 prompts representativos de tu sector y cuenta apariciones. Repite mensualmente.

4. Server logs

Filtra logs por user agent: GPTBot, OAI-SearchBot, ClaudeBot, PerplexityBot, Google-Extended. Mide frecuencia de visita. Un sitio con buena GEO recibe visitas diarias de OAI-SearchBot y Perplexity-User.

5. KPIs que sí mueven el negocio

Más allá de la vanity metric de "cuántas veces me citan", interesan tres indicadores accionables que sí correlacionan con ingresos:

Tres mini-casos reales que ilustran el método

Caso 1 · Consultora ISO en Castilla y León

Sitio con 80 artículos publicados entre 2021-2025 sobre ISO 9001, 14001 y 27001. Tráfico orgánico Google bajando un 18 % YoY en 2025 mientras el volumen de consultas en LLMs sobre certificación ISO subía. Acciones aplicadas en seis semanas: publicación de llms.txt con 22 URLs canónicas (pillars de cada norma + 4 landings de servicio), refactor del top 12 de artículos con H2-pregunta y FAQPage schema, anclas estables y tablas de cifras con cita a BOE. Resultado a los 60 días: 14 prompts comerciales de un panel de 30 ya devolvían el dominio en cita primaria de Perplexity y Claude, y el tráfico referrer desde perplexity.ai pasó de 3 sesiones/mes a 47.

Caso 2 · Marca personal de consultor B2B

Profesional independiente con 60 artículos largos sobre estrategia y RGPD. Caso replicable con bajo presupuesto. Acciones: schema Person con sameAs a LinkedIn y X consolidado, FAQPage en los 15 pilares más leídos, llms.txt minimalista (12 URLs), y mantenimiento trimestral declarado en dateModified. Resultado a los 90 días: aparición consistente en respuestas de Claude para 8 prompts de su nicho (de los cuales 5 con cita primaria) y un incremento del 22 % en leads inbound porque varios clientes reportaron "te conocí preguntando a ChatGPT".

Caso 3 · E-commerce nicho de productos artesanales

Catálogo de 400 SKUs con descripciones cortas. Aquí GEO se aplicó al nivel de ficha de producto: schema Product con aggregateRating real, FAQs específicas por categoría ("cómo conservar este producto", "alérgenos", "denominación de origen"), llms.txt con landing por categoría (no por SKU individual), y bloqueo de GPTBot en la sección de blog editorial (para proteger contenido original) pero permiso a OAI-SearchBot y PerplexityBot. El motor empezó a recomendarlo en consultas como "regalo gourmet artesano de Ribera del Duero".

Roadmap de implementación GEO en 90 días

Para una pyme con un sitio WordPress estándar y 30-200 artículos publicados, este es el calendario realista que aplicamos a clientes de consultoría:

SemanaAcciónEntregable
1Auditoría inicialInventario URLs canónicas, mapa de silos, lista de bots actualmente permitidos/bloqueados
2Permisos crawlerrobots.txt con política equilibrada (search bots permitidos, training bots según preferencia)
3llms.txt v1Archivo en raíz con 15-30 URLs canónicas curadas por silo
4-6Refactor pasajesTop 20 URLs por tráfico/conversión migradas a estructura H2 pregunta + respuesta directa + cifra con fuente
7-8SchemaArticle + Person + FAQPage + Speakable desplegados en plantilla del CMS
9Brand monitoringSuscripción a Profound u Otterly, baseline de share of voice en los 5 motores
10-12IteraciónOptimizar las 10 URLs con peor cobertura LLM detectada en el monitoring

Lo importante: no abandonar nada de SEO clásico durante el proceso. GEO se suma; no resta.

Preguntas frecuentes sobre GEO

¿Qué diferencia hay entre SEO y GEO?

SEO optimiza para aparecer en SERPs (10 enlaces azules) de buscadores como Google o Bing. GEO optimiza para aparecer dentro de las respuestas sintéticas que generan ChatGPT, Claude, Perplexity, Gemini o Copilot. La diferencia clave es la unidad de relevancia: SEO trabaja URLs completas, GEO trabaja pasajes citables. Ambas se solapan en señales de autoridad (E-E-A-T, backlinks, schema) pero divergen en arquitectura (llms.txt) y medición (share of voice en LLMs).

¿Bloquear GPTBot o ClaudeBot perjudica mi SEO?

No directamente. Bloquear bots de entrenamiento de OpenAI (GPTBot) o Anthropic (ClaudeBot) no afecta a Googlebot ni a Bingbot. Sin embargo, si bloqueas también los crawlers de búsqueda en vivo (OAI-SearchBot, Claude-Web, PerplexityBot) renuncias a aparecer en respuestas de esos motores. La política equilibrada es: bloquear entrenamiento si te preocupa el copyright, permitir búsqueda en vivo siempre que quieras tráfico referrer.

¿Es llms.txt obligatorio o solo una buena práctica?

No es obligatorio. llms.txt es una propuesta abierta (Answer.AI, 2024) que ningún LLM exige hoy. Sin embargo, varias plataformas técnicas (Anthropic, Vercel, Cursor, Stripe) ya lo publican porque mejora la calidad de las respuestas que esos LLMs dan sobre sus productos. Para un sitio B2B con arquitectura de silos, publicarlo te cuesta 10 minutos y te diferencia: el motor sabe qué páginas son las canónicas y cuáles ignorar.

¿Cómo sé si ChatGPT o Claude están citando mi sitio?

Dos vías. Vía manual: lanza 15-20 prompts representativos de tu sector (“mejor consultor SEO Burgos”, “qué es el AI Act”, “certificación ISO 27001 pyme”) y revisa si tu dominio aparece en las citas de las respuestas. Vía herramienta: plataformas como Profound, Otterly, Peec.ai o AthenaHQ automatizan miles de prompts mensuales, detectan tu share of voice frente a competidores y alertan de citas erróneas. Complementa con GA4 filtrando referrer chatgpt.com y perplexity.ai.

¿Cuánto tarda en notarse el impacto de optimizar para LLMs?

Mucho menos que en SEO. Los LLMs con búsqueda en vivo (ChatGPT Search, Claude con web search, Perplexity) refrescan su contexto en horas a días cada vez que un usuario hace una consulta nueva. Por tanto, publicar un artículo con FAQPage, schema y pasajes citables el lunes puede traducirse en citas el martes o miércoles. Los modelos de entrenamiento (cuando se libera la nueva versión) tardan meses, pero ya no son el canal principal: lo es la búsqueda en vivo.

¿Vale la pena publicar contenido específicamente para LLMs?

Solo si ese contenido también funciona para humanos. Crear FAQs sintéticas y largos listados de definiciones “para que el LLM las cite” es regresar al pattern de keyword stuffing de los 2000. La regla en 2026 es: redacta para un lector profesional curioso, añade schema y pasajes citables como capa técnica, y deja que el LLM elija. El contenido pensado solo para LLMs envejece mal y los motores generativos lo penalizan por superficialidad.

¿Qué errores debo evitar al hacer GEO en 2026?

Cinco antipatrones recurrentes. (1) Bloquear todos los bots LLM “por si acaso” y desaparecer del canal. (2) Publicar llms.txt con 4 000 URLs convertido en ruido. (3) Hardcodear FAQPage con preguntas inventadas en vez de las que tus clientes hacen. (4) Olvidar la fecha en dateModified — los LLMs descuentan contenido sin frescura visible. (5) Citar a otras fuentes sin verificarlas: si un LLM cita tu sitio y descubre que tu cita era incorrecta, perderás autoridad temática en consultas futuras.