Google utiliza el “grounding” para mejorar su precisión, pero según nuestra investigación, las AI Overviews son más propensas a citar contenido generado por IA que contenido escrito por humanos.
Esto es lo que hemos encontrado:
Tomamos de Keywords Explorer de Ahrefs un millón de SERPs que mostraban AI Overviews y extrajimos los tres primeros enlaces citados. Un total de 1,9 millones de URLs, de las cuales teníamos 500.000 en nuestra base de datos.
Pasamos cada URL por nuestro propio detector de contenido de IA, que forma parte de Page Inspect en Site Explorer de Ahrefs.
Esto es lo que nuestro detector de contenido encontró:
- 3,6 % de las páginas citadas en AI Overviews se clasificaron como “IA pura”.
- 8,6 % se clasificaron como “puramente humanas”.
- 87,8 % se clasificaron como una mezcla de ambas.
De las que eran una mezcla de humano e IA:
- 11,2 % mostraron un uso mínimo de IA (del 1 al 10 % del contenido de la página se clasificó como IA).
- 44 % mostraron un uso moderado de IA (11-40 %).
- 24,7 % mostraron un uso sustancial de IA (41 %-70 %).
- 7,9 % mostraron un uso dominante de IA (71 %-99 %).
Estos hallazgos se vuelven aún más sorprendentes cuando se comparan con nuestra investigación previa sobre el contenido de IA en la web. En nuestro análisis de 900.000 páginas nuevas, encontramos que:
- 2,5 % de las páginas se clasificaron como “IA pura”.
- 25,8 % se clasificaron como “puramente humano”.
- 71,7 % se clasificaron como una mezcla de ambas.
Aunque esta investigación solo analizó páginas nuevas (y no todas las URLs citadas en AI Overviews serán nuevas), esto sugiere que las AI Overviews de Google podrían mostrar un sesgo hacia la citación de contenido generado o asistido por IA en comparación con la distribución general de contenido en la web.
Calculamos la correlación entre el porcentaje de contenido de IA y el orden de las citas en las AI Overviews en todo nuestro conjunto de datos. La correlación fue de 0,017, efectivamente cero.
Esto sugiere que Google no penaliza ni recompensa explícitamente el contenido basándose en si es humano o generado por IA al seleccionar fuentes para las AI Overviews.
Pero considerando que el 87,8 % de las páginas citadas son al menos asistidas por IA, estamos viendo a la IA comerse su propia cola en tiempo real. El propio contenido generado por IA de Google está citando otro contenido generado por IA, creando así un bucle de retroalimentación.
Tampoco creo que Google esté siendo necesariamente descuidado. Parte de lo que estamos observando puede simplemente reflejar el estado actual de la web. Por ejemplo, en nuestro estudio de 900.000 páginas, encontramos que el 74 % de las nuevas páginas web incluyen contenido generado por IA.
Google depende de los creadores para el contenido. Pero los creadores utilizan cada vez más la IA para crear o ayudar en la creación de contenido. Por ejemplo, en nuestro informe sobre el estado de la IA en el marketing de contenidos, donde encuestamos a 879 profesionales del marketing, el 87 % de los encuestados utiliza la IA para ayudar a crear contenido.
Y aunque Google intenta mejorar la precisión mediante la generación aumentada por recuperación (RAG, por sus siglas en inglés), también hemos descubierto que el 86,5 % de las páginas mejor posicionadas contienen alguna cantidad de contenido generado por IA.
Esto significa que las AI Overviews se basan en un ecosistema de contenido que es cada vez más generado por IA. Estamos presenciando potencialmente el surgimiento de un ecosistema de contenido de IA donde las máquinas hablan con las máquinas.
El Detector de Contenido de IA de Ahrefs forma parte de Site Explorer de Ahrefs. Simplemente introduce cualquier URL, ve a Page inspect y luego haz clic en la pestaña Detector de IA.
Te dirá qué porcentaje del contenido es generado por IA y qué LLM se utilizó.
¿Tienes preguntas? Estamos en X y en LinkedIn.