Marketing general

Los LLM no recompensan la originalidad, la aplanan

Despina Gavoyannis
Despina es una Consultora SEO Senior con más de 8 años de experiencia en el crecimiento B2B, ecommerce, SaaS y marcas nacionales. Es una persona optimista y cada día se centra en disfrutar los aspectos positivos de la vida.
La originalidad está idealizada, especialmente en tecnología y marketing. Nos dicen que “pensemos diferente”, que acuñemos nuevos términos, que seamos pioneros en ideas que nadie ha escuchado antes y que compartamos nuestro liderazgo de pensamiento.

Pero en la era de la búsqueda impulsada por la IA, la originalidad no es la bendición que creemos que es. Incluso podría ser un lastre… o, en el mejor de los casos, un juego a largo plazo sin garantías.

Porque aquí está la incómoda verdad: los LLM no recompensan a los primeros. Recompensan el consenso.

Si múltiples fuentes no respaldan ya una nueva idea, puede que no exista. Puedes acuñar un concepto, publicarlo, incluso clasificarlo en número 1 en Google… y aún así ser invisible para los grandes modelos de lenguaje. Hasta que otros le hagan eco, la reformulen y la difundan, tu originalidad no importará.

En un mundo donde la IA resume en lugar de explorar, la originalidad necesita una multitud antes de ganarse el derecho a ser citada.

No me propuse intencionalmente probar cómo los LLM manejan las ideas originales, pero la curiosidad me golpeó tarde una noche, y terminé haciendo precisamente eso.

Mientras escribía un post sobre SEO multilingüe, acuñé un nuevo marco, algo que llamamos la Matriz SEO Multilingüe de Ahrefs.

Es un concepto nuevo diseñado para agregar ganancia de información al artículo. Lo tratamos como una pieza de liderazgo de pensamiento que tiene el potencial de dar forma a cómo las personas piensan sobre el tema en el futuro. También creamos una tabla personalizada e imagen de la matriz.

Así es como se ve:

Ejemplo de la Matriz de SEO Multilingüe de Ahrefs utilizada para mostrar cómo las variaciones en la segmentación regional y lingüística conducen a diferentes oportunidades de SEO.

El artículo ocupó el primer lugar para “matriz SEO multilingüe”. La imagen apareció en la AI Overview de Google. Fuimos citados, enlazados y presentados visualmente, exactamente el tipo de rendimiento SEO que esperarías de contenido original y útil (especialmente al buscar una palabra clave de coincidencia exacta).

La Matriz de SEO Multilingüe de Ahrefs citada por Google en las Descripciones Generativas con IA como un marco utilizado para organizar un sitio web para múltiples idiomas y regiones.

Pero, la respuesta de texto generada por IA alucinó una definición y se desvió del punto porque utilizó otras fuentes que hablan más generalmente sobre el tema principal, el SEO multilingüe.

TIP

Puedes verificar tu visibilidad en las Overviews de IA utilizando Brand Radar de Ahrefs. Busca tu marca junto con temas centrales o comparada con competidores y ve cuánta visibilidad también estás obteniendo:

Brand Radar de Ahrefs para el seguimiento de la visibilidad en las Descripciones Generativas con IA

Siguiendo mi curiosidad, luego consulté varios LLM, incluyendo ChatGPT (4o), GPT Search y Perplexity, para ver cuánta visibilidad este concepto original podría realmente obtener.

El patrón general que observé es que todos los LLM:

  • Tenían acceso al artículo e imagen
  • Tenían la capacidad de citarlo en sus respuestas
  • Incluyeron el término exacto múltiples veces en las respuestas
  • Alucinaron una definición de información genérica
  • Nunca mencionaron mi nombre o Ahrefs, es decir, los creadores
  • Cuando se les volvió a preguntar, frecuentemente nos daban cero visibilidad

En general, se sintió académicamente deshonesto. Como si nuestro contenido fuera citado correctamente en las notas al pie (a veces), pero el término original que habíamos acuñado se repitiera en las respuestas mientras se parafraseaban otras fuentes no relacionadas (casi siempre).

Respuesta de ChatGPT cuando se le preguntó sobre la Matriz de SEO Multilingüe, alucinando una respuesta a pesar de citar el artículo de Ahrefs como referencia.

Respuesta de ChatGPT cuando se le preguntó sobre la Matriz de SEO Multilingüe, alucinando una respuesta a pesar de citar el artículo de Ahrefs como referencia. Además, la cita al artículo era visible solamente al hacer clic.

También se sintió como si el concepto fuera absorbido en la definición general de “SEO multilingüe”.

Ese momento es lo que desató la epifanía: los LLM no recompensan la originalidad. La aplanan.

Este no fue un experimento riguroso, fue más como un seguimiento curioso. Especialmente porque cometí algunos errores en la publicación original que probablemente dificultaron que los LLM se aferraran a una definición explícita.

Sin embargo, expuso algo interesante que me hizo reconsiderar cuán fácil podría ser ganar menciones en las respuestas de los LLM. Es lo que yo considero como “aplanamiento de los LLM”.

El aplanamiento de los LLM es lo que sucede cuando los grandes modelos de lenguaje pasan por alto el matiz, la originalidad y las ideas innovadoras en favor de resúmenes simplificados y basados en el consenso. Al hacerlo, comprimen voces distintas e ideas nuevas en la versión más segura y estadísticamente reforzada de un tema.

Esto puede ocurrir a un nivel micro y macro.

Aplanamiento Micro de los LLM

El aplanamiento micro de los LLM ocurre a nivel de tema donde los LLM reformulan y sintetizan el conocimiento en sus respuestas para ajustarse al consenso o al patrón más autoritario sobre ese tema.

Cómo los LLMs aplanan la originalidad a un nivel micro para temas individuales.

Ilustración de cómo los LLM reformulan la distribución del conocimiento. Un tema con conocimiento establecido y poca innovación (izquierda) contrasta con uno con alta innovación (centro), donde ideas emergentes se integran. Los LLM (derecha) tienden a excluir ideas y a “aplanar” las novedosas hacia un consenso emergente dentro del conocimiento central.

Hay casos límite donde esto no ocurre, y por supuesto, puedes preguntar a los LLM por respuestas más matizadas.

Sin embargo, dado lo que sabemos sobre cómo funcionan los LLM, probablemente seguirán luchando para conectar un concepto con una fuente distinta con precisión. OpenAI explica esto usando el ejemplo de un profesor que sabe mucho sobre su materia pero no puede recordar con precisión dónde aprendió cada pieza distinta de información.

Captura de pantalla del ejemplo de Open AI sobre cómo ChatGPT utiliza datos de entrenamiento en sus respuestas.

Entonces, en muchos casos, las nuevas ideas simplemente se absorben en el conjunto general de conocimiento del LLM.

Dado que los LLM funcionan semánticamente (basado en el significado, no en coincidencias exactas de palabras), incluso si buscas un concepto exacto (como lo hice para la “matriz SEO multilingüe”), tendrán dificultades para conectar ese concepto con una persona o marca específica que lo originó.

Es por eso que las ideas originales tienden a suavizarse para que encajen en el consenso sobre un tema o no se incluyen en absoluto.

Aplanamiento Macro de los LLM

El aplanamiento macro de los LLM puede ocurrir con el tiempo a medida que las nuevas ideas luchan por surgir en las respuestas de LLM, “aplanando” nuestra exposición a la innovación y las exploraciones de nuevas ideas sobre un tema.

Cómo el aplanamiento de los LLMs ocurre a un nivel macro, reduciendo la visibilidad de nuevas ideas en las respuestas con el tiempo.

La gráfica muestra cómo la visibilidad de ideas originales (eje Y) evoluciona con el tiempo (eje X). Sin LLM (línea rosa), la visibilidad aumenta continuamente. Con LLM (línea azul), la visibilidad de nuevas ideas se aplana tras alcanzarse un “consenso” o patrón dominante, fenómeno denominado como “aplanamiento” de los LLM.

Este concepto se aplica en todos los ámbitos, cubriendo todas las nuevas ideas que las personas crean y comparten. Debido al aplanamiento que puede ocurrir a nivel de tema, significa que los LLM podrían mostrar menos ideas nuevas con el tiempo, tendiendo a repetir la información o los puntos de vista más dominantes sobre un tema.

Esto sucede no porque las nuevas ideas dejen de acumularse, sino porque los LLM reescriben y resumen el conocimiento, a menudo alucinando sus respuestas.

En ese proceso, tienen el potencial de dar forma a nuestra exposición al conocimiento de formas que otras tecnologías (como los motores de búsqueda) no pueden.

A medida que la visibilidad de las ideas originales o los nuevos conceptos se aplana, eso significa que muchos creadores y marcas más nuevos o más pequeños pueden tener dificultades para ser vistos en las respuestas de LLM.

El statu quo pre-LLM era cómo Google mostraba la información.

Normalmente, si el contenido estaba en el índice de Google, podías verlo en los resultados de búsqueda al instante cada vez que lo buscabas. Especialmente al buscar una frase única que solo tu contenido usaba.

El listado de tu marca en los resultados de búsqueda mostraría las partes de tu contenido que coinciden con la consulta textualmente:

Captura de pantalla de un resultado de búsqueda de Google para la publicación de SEO multilingüe de Ahrefs.

Eso es gracias a la parte “léxica” del motor de búsqueda de Google que todavía funciona basándose en la coincidencia de cadenas de palabras.

Pero ahora, incluso cuando una idea es correcta, incluso cuando es útil, incluso cuando ocupa el puesto número 1 en la búsqueda, si no se ha repetido lo suficiente en las fuentes, los LLM a menudo no la mostrarán. También puede que no aparezca en las AI Overviews de Google a pesar de ocupar el puesto número 1 orgánicamente.

Incluso si buscas un término único que solo tu contenido usa, como lo hice para la “matriz SEO multilingüe”, a veces tu contenido aparecerá en las respuestas de IA y otras veces no.

Los LLM no atribuyen. No rastrean el conocimiento hasta su origen. Simplemente resumen lo que ya se ha dicho, una y otra vez.

Eso es lo que hace el aplanamiento:

  • Redondea la originalidad
  • Estanca la descubribilidad
  • Hace invisible la innovación

Eso no es un problema de datos. Es un problema de patrón que se inclina hacia el consenso para la mayoría de las consultas, incluso aquellas donde el consenso no tiene sentido.

Los LLM no coinciden con cadenas de palabras; coinciden con el significado, y el significado se infiere de la repetición.

Eso hace que la originalidad sea más difícil de encontrar y más fácil de olvidar.

Y si se muestran menos ideas originales, menos personas las repiten. Lo que significa menos oportunidades para que los LLM las descubran y las recojan en el futuro.

Dilema del descubrimiento de nuevas ideas que necesitan repetición antes de poder ser descubiertas.

Dilema del descubrimiento de nuevas ideas que necesitan repetición antes de poder ser descubiertas.

Los LLM parecen saberlo todo, pero no lo saben todo. Se equivocan con confianza y mucho.

Una de las mayores críticas a las respuestas generadas por IA es que a menudo son completamente inexactas… bueno, esta es la razón. Si son incapaces de atribuir un concepto original a su creador, ¿cómo van a calcular dónde más su interpretación de su conocimiento es errónea?

Los grandes modelos de lenguaje tendrán cada vez más acceso a todo. Pero eso no significa que lo entiendan todo.

Recopilan conocimiento, no lo cuestionan.

Colapsan el matiz en la narrativa.

Y tratan la repetición como verdad.

Y aquí está lo nuevo: lo dicen todo con confianza. Los LLM no poseen capacidad de razonamiento (todavía) o juicio. Pero sienten como si la tuvieran y te dirán directamente, con confianza, que la tienen.

Como ejemplo, aquí ChatGPT siendo un amigo y reforzando este concepto de que los LLM simulan el juicio de manera convincente:

Ejemplo de la capacidad de ChatGPT para simular el juicio de manera convincente.

¿Cuán meta es que a pesar de no tener una forma real de saber estas cosas sobre sí mismo, ChatGPT respondió de manera convincente como si, de hecho, lo supiera?

A diferencia de los motores de búsqueda, que actúan como mapas, los LLM presentan respuestas.

No solo recuperan información, la sintetizan en una prosa fluida y de sonido autoritario. Pero esa fluidez es una ilusión de juicio. El modelo no está sopesando ideas. No está evaluando la originalidad.

Solo está emparejando patrones, repitiendo la forma de lo que ya se ha dicho.

Sin un patrón para anclar una nueva idea, los LLM no saben qué hacer con ella, o dónde colocarla en el tejido del conocimiento colectivo de la humanidad.

Este no es un problema nuevo. Siempre hemos luchado con cómo se filtra, se muestra y se distribuye la información. Pero esta es la primera vez que esas limitaciones se han disfrazado tan bien.

Entonces, ¿qué hacemos con todo esto? Si la originalidad no se recompensa hasta que se repite, y el crédito se desvanece una vez que se convierte en parte del consenso, ¿cuál es la estrategia?

Es una pregunta que vale la pena hacer, especialmente mientras reconsideramos cómo se ve realmente la visibilidad en el panorama de búsqueda impulsado por la IA.

Algunos cambios prácticos que vale la pena considerar a medida que avanzamos:

  • Etiqueta tus ideas claramente: Dales un nombre. Haz que sean fáciles de referenciar y buscar. Si suena como algo que la gente puede repetir, podrían hacerlo.
  • Añade tu marca: Incluir tu marca como parte de la etiqueta de la idea te ayuda a ganar crédito cuando otros mencionan la idea. Cuanto más se repita tu marca junto con la idea, mayor será la probabilidad de que los LLM también mencionen tu marca.
  • Define tus ideas explícitamente: Añade una sección de “¿Qué es [tu concepto]?” directamente en tu contenido. Explícalo en lenguaje sencillo. Hazlo legible tanto para los lectores como para las máquinas.
  • Autorreferencia con propósito: No solo dejes caer el término en un pie de foto o texto alternativo de una imagen: utilízalo en el cuerpo de tu texto, en los encabezados, en los enlaces internos. Deja claro que eres el origen.
  • Distribúyelo ampliamente: No te bases en una sola publicación de blog. Vuelve a publicar en LinkedIn. Habla de ello en podcasts. Suéltalo en boletines informativos. Dale a la idea más de un lugar para vivir para que otros también puedan hablar de ella.
  • Invita a otros a participar: Pide a colaboradores, colegas o a tu comunidad que mencionen la idea en su propio trabajo. La visibilidad requiere una red. Hablando de eso, siéntete libre de compartir las ideas del “aplanamiento de los LLM” y la “Matriz SEO Multilingüe” con cualquiera, en cualquier momento 😉
  • Juega a largo plazo: Si la originalidad tiene un lugar en la búsqueda con IA, es como una semilla, no como un atajo. Asume que tomará tiempo y trata la tracción temprana como una ganancia adicional, no como una base.

Y finalmente, decide qué tipo de reconocimiento te importa.

No todas las ideas necesitan ser citadas para ser influyentes. A veces, la mayor victoria es ver cómo tu pensamiento moldea la conversación, incluso si tu nombre nunca aparece junto a ella.

Reflexiones finales

La originalidad sigue importando, solo que no de la forma en que nos enseñaron.

No es un truco de crecimiento. No es un diferenciador garantizado. Ni siquiera es suficiente para que te citen en estos días.

Pero así es cómo comienza el consenso. Es el momento antes de que se forme el patrón. La chispa que (si se repite lo suficiente) se convierte en la señal en la que los LLM eventualmente aprenden a confiar.

Así que, crea la nueva idea de todos modos.

Solo no esperes que hable por sí misma. No en este panorama de búsqueda actual.

¿Tienes preguntas? Estamos en X.