Estaba mirando nuestro filtro LLM en Web Analytics de Ahrefs y noté que faltaban algunos motores generativos comunes en la lista. Están en nuestros filtros, pero no estamos viendo ningún dato de ellos para los sitios.
Este problema del tráfico invisible viene de que estos sistemas eliminan el valor de referencia. Noté por primera vez este problema con AI Mode en Google, pero es un problema común para los motores generativos.
Esto es muy probablemente un error por su parte, pero en algunos casos puede ser intencional. Algunas de estas herramientas probablemente quieren más cuota de mercado y simplemente cometieron un error, mientras que otras pueden no querer que puedas medir el tráfico desde los sistemas. Google ha dicho que los clics de AI Search son de mayor calidad, pero no tenemos forma de verificarlo.
Si tienes un sitio web que envía tráfico a otros sitios, deberías querer que se rastree correctamente. En el caso de los motores generativos, advertí que estos bots de IA necesitan enviar esa información para cumplir su contrato social, donde proporcionan tráfico a los sitios web, y los sitios web permiten que estos bots rastreen y que sus datos sean utilizados.
Hay un coste para que los bots rastreen tus sitios web y existe un contrato social entre los motores de búsqueda y los propietarios de sitios web, donde los motores de búsqueda añaden valor enviando tráfico de referencia a los sitios web. Esto es lo que evita que la mayoría de los sitios web bloqueen los motores de búsqueda como Google, incluso cuando Google parece tener la intención de quedarse con una mayor parte de ese tráfico para sí mismos. Este contrato social se extiende a los motores generativos.Creo que muchos propietarios de sitios quieren permitir que estos bots aprendan sobre su marca, su negocio y sus productos y ofertas. Pero aunque mucha gente apuesta a que estos sistemas son el futuro, actualmente corren el riesgo de no añadir suficiente valor para los propietarios de sitios web.
El primer LLM en añadir más valor a los usuarios mostrando impresiones y clics a los propietarios de sitios web probablemente tendrá una gran ventaja. Las empresas informarán sobre las métricas de ese LLM, lo que probablemente aumentará la adopción y evitará que más sitios web bloqueen su bot.
La misma opinión es válida para la atribución. Si estos motores generativos quieren ganar cuota de mercado, necesitan estar presentes en los informes a las empresas. Hasta ahora, muchos no lo están haciendo muy bien..
Metodología y hallazgos
Estaba comprobando el valor de referencia escribiendo “document.referrer” en la Consola de Herramientas para Desarrolladores de Chrome (Chrome DevTools) para ver si la referencia se pasaba. Si se pasa, muestra un valor diciendo de dónde viene, y si no, está en blanco.
Algunos de los motores generativos envían las referencias, otros no las envían en absoluto, y algunos las envían para ciertas cosas y no para otras. He marcado aquellos con una advertencia para indicar resultados parciales.
ChatGPT ⚠️
Un enlace dentro del contenido en mi cuenta de pago de ChatGPT tiene un atributo noreferrer en el enlace. Esto evitaría que el valor de referencia fuera enviado.
Como se esperaba, no se muestra ningún valor de referencia en la Consola de Chrome DevTools. Devuelve un valor vacío.
document.referrer ''
En Web Analytics de Ahrefs, esto se registra como Desconocido, pero en Google Analytics se clasificaría como Directo. Google agrupa el tráfico de fuentes desconocidas y el tráfico interno del sitio web como Directo, mientras que nosotros los separamos en Desconocido e Interno.
Lo que es interesante es que cuando revisé el mismo tipo de enlace en una cuenta gratuita, no tenía el atributo noreferrer. Se rastrea correctamente.
Para listas de enlaces, también se rastrearon correctamente.
Los enlaces a las Fuentes en el contenido y al final de la respuesta también se rastrean correctamente, y además añaden un parámetro URL “?utm\_source=chatgpt.com” a las URLs.
Búsqueda Web
La mayoría de los enlaces en el modo Búsqueda Web tenían la referencia. Encontré un ejemplo interesante cuando hay múltiples referencias. La principal tenía una referencia, las otras 2 no.
DeepResearch
Para el modo DeepResearch, los enlaces dentro del contenido se atribuyeron correctamente, pero las fuentes al final estaban marcadas con noreferrer.
Cabeceras HTTP
Si miras las Cabeceras HTTP, a veces encontrarás una cabecera Referrer-Policy para especificar qué y cuánta información se pasa en la referencia. Puedes usar la Barra de herramientas SEO de Ahrefs para ver esta información yendo a la pestaña de cabeceras HTTP.
Para ChatGPT, han establecido un valor de referrer-policy de “strict-origin-when-cross-origin”. En este caso, la degradación de HTTPS a HTTP eliminaría la referencia. Cualquier enlace a páginas que utilicen HTTP no se atribuiría correctamente.
Google Gemini ⚠️
La mayoría de los enlaces contextuales y citados dentro de Gemini sí tenían la referencia.
El único caso en el que no la tenía fue la sección “Investigando sitios web” en el modo Deep Research. Estos están marcados como noreferrer.
AI Mode
El nuevo Modo IA en la Búsqueda de Google también está impulsado por Gemini. Puede que hayas visto mi reciente artículo mostrando que el Modo IA está marcado con noreferrer.
John Mueller de Google ha confirmado desde entonces que es un error y que probablemente lo solucionarán.
Microsoft Copilot Web ✅ Windows ❌
En un artículo anterior, Louise Linehan mencionó que podríamos estar subestimando el tráfico de IA. Ella mencionó específicamente cómo Copilot desapareció de nuestro sistema de seguimiento de analíticas. Desde entonces, el tráfico ha regresado.
Lo que sospecho es que estos enlaces fueron marcados como noreferrer durante ese período de tiempo. Esto muestra cómo los cambios en el código pueden impactar tu seguimiento global.
Todo aquí parecía estar rastreado correctamente ahora.
Ese no es el caso con Copilot en Windows. No encontré ningún caso donde se pasara la referencia.
Perplexity Web ✅ Escritorio❌
Su sitio web parecía enviar referencias en todo.
Su aplicación de escritorio no parece enviar referencias en nada. No probé la aplicación móvil.
Claude ✅
Claude parece tener la referencia para todos los enlaces en todas las áreas que probé.
Grok ❌
Grok no parece pasar el valor de referencia en absoluto. Probé tanto el Grok independiente como la versión en X.
DeepSeek ⚠️
El DeepSeek normal y Deep Research no pasaron el valor de referencia.
Para la búsqueda web, las citas individuales pasaron la referencia, pero los enlaces al final no lo hicieron.
Meta AI ✅
Meta AI pasó el valor de referencia para la versión web. No probé esto en ninguna de las plataformas de redes sociales.
Mistral ✅
Mistral pasó el valor de referencia en todas las instancias que revisé.
Reflexiones finales
Los problemas de atribución no son exclusivos de los motores generativos. Mucho tráfico se atribuye a Desconocido o Directo en tus analíticas. Ese tráfico vino de alguna parte.
Hay una buena parte del tráfico web que nunca se registra en las analíticas porque la gente bloquea las analíticas o JavaScript, algunos sitios esperan la aceptación de cookies antes de activarse, o la gente abandona una página antes de que se active tu etiqueta de analíticas.
La atribución se está volviendo más difícil cada año. Si eres un motor generativo y quieres asegurarte de que la gente sepa que está recibiendo tráfico de ti, prueba todos tus enlaces para asegurarte de que los datos se están enviando. Tu propia supervivencia podría depender de tu reputación en la comunidad de marketing y de la visibilidad que tengas en los informes de marketing.
¿Tienes preguntas? Estamos en X.