Marketing general

¿Qué sentido tienen los detectores de IA?

Ryan Law
Ryan is the Director of Content Marketing at Ahrefs. He helps the team with spicy opinions, deep research, and wild experiments.
Acabamos de lanzar nuestro nuevo detector de contenido de IA. Ya está disponible en Page Inspect, dentro de Site Explorer. Puedes probarlo tú mismo.

Antes era escéptico con los detectores de contenido de IA, y mucha gente todavía lo es. Andrew Holland compartió recientemente un comentario en LinkedIn que resume bien las preocupaciones más comunes:

Captura de pantalla de una publicación de LinkedIn de Andrew Holland. La publicación discute tres aspectos de los detectores de IA: precisión, el impacto en el contenido humano y su propósito. Se mencionan puntos sobre Medium usando detectores de IA y la relevancia de que la IA genere contenido. La publicación incluye interacciones de "Me gusta" y comentarios.

En resumen:

  • Los detectores de contenido de IA no son precisos.
  • Los detectores de contenido de IA son herramientas punitivas.
  • Los detectores de contenido de IA no son útiles.

Son preocupaciones válidas, así que quería abordarlas una por una y explicar por qué los detectores de IA son una herramienta útil en un mundo donde el 74% del nuevo contenido se crea con la ayuda de la IA generativa.

He probado muchos detectores de IA y he visto cómo etiquetaban incorrectamente mi trabajo, hecho por un humano cualificado, como “generado por IA”. Y probablemente habrás visto ocasiones en las que la Declaración de Independencia, un discurso famoso o pasajes de la Biblia fueron etiquetados con seguridad (y de forma muy incorrecta) como generados por IA.

Pero en la literatura académica, los detectores de IA alcanzan habitualmente tasas de detección exitosa del 80% (o superiores). OpenAI informa de que detecta texto generado por sus modelos con una precisión del 99,9%.

Aquí hay un ejemplo de cómo nuestro detector de IA acierta en la detección de contenido, identificando correctamente las secciones del artículo de Patrick generadas con GPT-4o:

Captura de pantalla de la herramienta "AI Detector" de Ahrefs, mostrando las métricas de un texto analizado. A la izquierda, se definen métricas clave para el ROI de SEO, como "Total SEO Costs", "Total Customers Acquired", "Average Revenue per Customer (ARPC)", "Churn Rate", "Gross Margin" y "Discount Rate". A la derecha, se observa una sección titulada "AI content level" con una barra de progreso que indica "High" y "70% of the content is AI generated".

Aquí hay otro ejemplo de uno de mis sitios web de pasatiempos, donde el modelo reconoce correctamente que usé uno de los modelos Llama de Meta para escribir el artículo:

Captura de pantalla de una herramienta de detección de IA. El encabezado de la página incluye las pestañas "Texto", "Detector de IA" y "HTML", con la pestaña "Detector de IA" seleccionada. A la derecha, un cuadro titulado "Nivel de contenido de IA" muestra "Muy alto" y "100% del contenido es generado por IA". Debajo, un gráfico circular titulado "AI Ratio" es completamente naranja, con la leyenda "Llama" (naranja) al 100% y "Humano" (verde) a "<1%".

Estos no son conjeturas al azar. Es una detección precisa. Entonces, ¿qué explica la aparente brecha entre la teoría y la práctica? ¿Cómo pueden los detectores de IA estar tan equivocados y tan acertados al mismo tiempo?

  • Los textos “famosos” suelen estar en los conjuntos de datos de la IA. Muchos de los ejemplos más flagrantes de detectores de IA que se equivocan son, en realidad, un comportamiento esperado. Los textos famosos se encuentran normalmente en los datos de entrenamiento de los LLM, dando forma a los patrones de escritura que los detectores de IA buscan y causando un falso positivo. Como explicó Mark Williams-Cook en LinkedIn, marcar un discurso político famoso como generado por IA “...es la respuesta correcta cuando construyes una herramienta para identificar el resultado de un corpus de datos de entrenamiento, pero luego eliges introducirle parte de esos datos de entrenamiento”.
  • Muchos detectores de IA gratuitos están sobrevalorados. Muchos detectores de IA gratuitos son simples llamadas a una API que son poco mejores que generadores de números aleatorios. Una detección eficaz requiere modelos de detección afinados y actualizaciones regulares para mantenerse al día con los nuevos lanzamientos de modelos. Esto es difícil y caro de conseguir, y la mayoría de las herramientas gratuitas no lo intentan.
  • Los detectores de IA son fáciles de usar mal. La mayoría de los modelos de detección funcionan mejor cuando se usan en el mismo tipo de contenido con el que fueron entrenados. El texto de IA es mucho más difícil de detectar cuando se “humaniza” o cuando los documentos contienen una mezcla de texto escrito por humanos y generado por IA. Estas son limitaciones bien conocidas, pero no suelen comunicarse a los usuarios.
  • No siempre hay respuestas claras. A medida que los flujos de trabajo de escritura incorporan la IA de formas más sutiles y matizadas, se vuelve más difícil responder a la pregunta “¿está esto generado por IA?”. ¿Algo está generado por IA si fue escrito por un humano pero corregido por IA? ¿O si fue esquematizado por IA pero escrito por un humano? Son líneas cada vez más borrosas.

Al igual que los LLM, los detectores de IA son modelos estadísticos. Operan con probabilidades, no con certezas. Pueden ser increíblemente precisos, pero siempre conllevan el riesgo de falsos positivos.

Si entiendes estas limitaciones, los falsos positivos no tienen por qué ser problemáticos. No le des demasiado peso a un único resultado. Realiza muchas pruebas y observa la tendencia de los resultados. Combina los resultados con otras formas de evidencia.

Pero muchos detectores de IA se promocionan como máquinas infalibles que dicen la verdad. Eso crea falsas expectativas y fomenta que se usen de malas maneras que no reflejan cómo funcionan realmente. Lo que nos lleva a la segunda objeción…

Todos hemos oído hablar de estudiantes suspendidos por culpa de los detectores de IA, o de redactores freelance que pierden contratos porque su trabajo fue considerado incorrectamente como generado por IA. Son problemas reales causados por el mal uso de los detectores de IA.

Vale la pena decirlo de forma concreta: ningún detector de IA debería usarse para tomar decisiones de vida o muerte sobre la carrera o el expediente académico de alguien. Este es un mal uso de la tecnología y una mala interpretación de cómo funcionan estas herramientas.

Pero no creo que la solución a estos problemas sea abandonar por completo la detección de contenido de IA.

Existe una demanda real y apremiante de estas herramientas. Mientras escribo esto, “ai detector” se busca 2,5 millones de veces al mes, y la demanda ha estado creciendo rápidamente. Mientras podamos generar texto con IA, habrá utilidad en identificarlo.

Gráfico de volumen de búsqueda titulado "Search volume". El volumen de búsqueda actual es de 2,5 millones, con un crecimiento del +39% y una previsión del +35%. El gráfico de línea muestra la tendencia del volumen de búsqueda desde septiembre de 2015 hasta mayo de 2026.

La educación es una mejor respuesta. Las personas que construyen y promocionan detectores de contenido de IA necesitan ayudar a los usuarios a entender las limitaciones de sus herramientas. Necesitamos fomentar un uso más inteligente, siguiendo algunas pautas básicas:

  • Intenta aprender todo lo posible sobre los datos de entrenamiento del detector y utiliza modelos entrenados con material similar al que quieres analizar.
  • Analiza múltiples documentos del mismo autor. ¿El ensayo de un estudiante ha sido marcado como generado por IA? Pasa todos sus trabajos anteriores por la misma herramienta para tener una mejor idea de su tasa de base.
  • Nunca uses detectores de contenido de IA para tomar decisiones que afectarán a la carrera o al expediente académico de alguien. Utiliza siempre sus resultados junto con otras formas de evidencia.
  • Úsalo con una buena dosis de escepticismo. Ningún detector de IA es 100% preciso. Siempre habrá falsos positivos.

Hay muchas maneras malas y absurdas de usar los detectores de IA, pero también hay muchos casos de uso buenos. Lo que me lleva a la objeción final…

La IA generativa está integrada de forma nativa en Google Docs, Gmail, LinkedIn y la Búsqueda de Google. El texto de IA se está entretejiendo de manera inextricable en la estructura de internet. Ya es un hecho, así que, ¿para qué molestarse siquiera en intentar detectarlo?

Hay una gran verdad en esto. Nuestro detector de IA estima que el 74% de las nuevas páginas publicadas en abril de 2025 contenían alguna cantidad de texto generado por IA. Este número solo crecerá con el tiempo.

Gráfico circular que ilustra la proporción de páginas web creadas o asistidas por IA. El título del gráfico es "¿Cuántas páginas se crean/asisten con IA?", y se especifica que está basado en un estudio de Ahrefs de más de 900k páginas web, publicado en abril de 2025 (una por dominio).

He usado antes la analogía del acero post-nuclear. Desde la detonación de las primeras bombas nucleares, cada pieza de acero fabricada ha sido “contaminada” por la lluvia radiactiva. No es difícil imaginar un mundo donde cada pieza de contenido esté igualmente “contaminada” por el resultado de la IA.

Pero esta, para mí, es la mayor justificación para usar un detector de IA. Internet entero está siendo inundado con los resultados de los LLM, por lo que necesitamos entender lo más posible sobre las herramientas y técnicas que dan forma al contenido con el que interactuamos cada día.

Quiero saber

  • Qué modelos de IA son los mejores para crear contenido de alta calidad.
  • Con qué frecuencia mis competidores publican contenido de IA y qué modelos usan.
  • Qué tan fácil es para otras empresas (como Google) detectar nuestro contenido de IA.
  • Cuánto contenido de IA hay en una SERP en particular y cuánto esfuerzo necesito invertir para posicionarme.
  • Cómo se correlacionan las métricas de rendimiento orgánico con diferentes niveles de uso de IA, como el tráfico de búsqueda, el posicionamiento de palabras clave y los backlinks (mientras escribo esto, estamos realizando un estudio sobre ello).

El objetivo de la detección de contenido de IA no es hacer juicios morales en blanco y negro sobre el uso de la IA: esto es contenido de IA, por lo tanto, es malo; esto es contenido humano, por lo tanto, es bueno. La IA se puede usar para crear contenido excelente (si has leído el blog de Ahrefs recientemente, has estado leyendo contenido que contiene texto generado por IA).

El objetivo es entender qué funciona bien y qué no; recopilar datos que ofrezcan alguna ventaja y ayuden a mejorar el crecimiento de tu sitio web y tu negocio.

Reflexiones finales

La mayor parte del nuevo contenido en la web se crea con la ayuda de la IA generativa. Personalmente, quiero toda la información sobre esa IA que pueda conseguir.

Nuestro nuevo detector de IA ya está disponible en Site Explorer. Puedes probarlo tú mismo, hacer experimentos y empezar a entender el impacto que la IA generativa está teniendo en la visibilidad online.

Captura de pantalla de la interfaz de usuario de la herramienta Page Inspect dentro de Site Explorer de Ahrefs.

¿Tienes preguntas? Estamos en X.