
El detector de IA de Ahrefs analizando una página web.
Hay un montón de detectores de IA disponibles. Y, aunque el nuestro es el único que puede mostrarte también los backlinks y el tráfico de búsqueda estimado de cualquier página web, cómo ha cambiado el contenido de la página con el tiempo y cómo rinde en comparación con otras páginas…
…seguíamos queriendo saber cómo se compara el detector de IA de Ahrefs con otros detectores populares. Así que lo hemos probado.
Tomé una muestra de nueve artículos, que consistía en tres artículos escritos por humanos, tres artículos totalmente generados por IA y tres artículos híbridos que contenían una mezcla de 50 % de contenido escrito por humanos y 50 % de contenido generado por IA.
Analicé cada artículo con detectores de IA gratuitos de Ahrefs (nosotros), Scribbr, Grammarly, ZeroGPT, Copyleaks, Writer, GPTZero y Originality.ai. En algunos casos, fue necesario truncar la muestra de texto probada.
Normalicé los resultados (por ejemplo, traduciendo una puntuación de “24 % humano” al equivalente “76 % IA”) y los puntué utilizando la siguiente rúbrica:
- 2 puntos si la puntuación del detector está dentro de un margen de ±10 puntos porcentuales del valor real.
- 1 punto si está dentro de un margen de ±20 puntos.
- 0 puntos en caso contrario.
Es importante destacar que esta no es una prueba científica. El tamaño de la muestra es muy pequeño, mi rúbrica de puntuación es arbitraria y todos estos son artículos que he escrito, generado o editado. Esto era necesario para asegurarme de que conocía la composición de cada artículo, pero significa que estas muestras están sesgadas hacia un estilo de escritura particular (el mío).
En lugar de eso, piensa en esto como una rápida comprobación del estado de los detectores de contenido de IA. Muchos de los principales detectores de IA tuvieron un rendimiento muy bueno.
Según mis pruebas, el detector de IA de Ahrefs y Copyleaks fueron los detectores de IA con mejor rendimiento, con GPTZero y Originality.ai pisándoles los talones. En el otro extremo de la escala, Grammarly y Writer fueron los que peores resultados obtuvieron en mis pruebas.
Curiosamente, los falsos positivos no fueron un gran problema. Solo 2 de las 24 pruebas realizadas en contenido escrito por humanos marcaron incorrectamente la muestra de texto como generada por IA. Todos los detectores de IA tuvieron más dificultades con el contenido híbrido humano/IA (por razones que se explican más adelante).
En la siguiente tabla, puedes ver el contenido real de IA de cada artículo de prueba, seguido del análisis de cada herramienta:
% real de IA | Ahrefs | Copyleaks | GPTZero | Originality.ai | Scribbr | ZeroGPT | Grammarly | Writer |
---|---|---|---|---|---|---|---|---|
100% | 100% | 100% | 92% | 100% | 94% | 99,62% | 59% | 24% |
100% | 100% | 100% | 100% | 100% | 100% | 98,99% | 57% | 23% |
100% | 86% | 83,8% | 52% | 64% | 0% | 67,76% | 7% | 15% |
0% | 2% | 0% | 0% | 0% | 0% | 0% | 0% | 2% |
0% | 6% | 0% | 0% | 0% | 0% | 2,76% | 0% | 2% |
0% | 0% | 0% | 4% | 0% | 0% | 91,69% | 0% | 27% |
50% | 13% | 46,4% | 42% | 46% | 0% | 39,06% | 0% | 0% |
50% | 32% | 0% | 28% | 4% | 0% | 29,4% | 0% | 5% |
50% | 70% | 100% | 86% | 4% | 83% | 83,21% | 0% | 6% |
Puntuación | 13 | 13 | 12 | 12 | 10 | 9 | 6 | 4 |
Detector de IA de Ahrefs
Puntuación: 13/18
URL: https://ahrefs.com/es/writing-tools/ai-content-detector
El AI Content Detector de Ahrefs mostró una buena precisión en general, sin falsos positivos para el contenido escrito por humanos y una buena detección del contenido de IA. También logró detectar los tipos de modelos específicos utilizados para el contenido de IA: GPT-4o y Llama de Meta.
Según mis criterios, falló una de cada nueve pruebas, teniendo dificultades para identificar el contenido de IA que se mezclaba con la escritura humana. Esta es una limitación conocida de todas las herramientas de detección de IA (más sobre esto a continuación), y fue cierta para todos los modelos de detección.
El detector de IA de Ahrefs se basa en nuestro propio modelo de detección patentado, entrenado con una gran cantidad de contenido web. Es único entre los detectores de IA porque puedes usarlo junto con toneladas de otros puntos de datos de Ahrefs para ver cómo rinde realmente el contenido.
Puedes usar el detector de IA de Ahrefs para ver:
- Qué modelos de IA son los mejores para crear contenido de alta calidad.
- Con qué frecuencia tus competidores publican contenido de IA y qué modelos utilizan.
- Cuánto contenido de IA está presente en una SERP en particular y cuánto esfuerzo podrías necesitar invertir para posicionarte.
- Cómo se correlacionan las métricas de rendimiento orgánico con diferentes niveles de uso de IA, como el tráfico de búsqueda, el posicionamiento de palabras clave y los backlinks.
- Si el uso de contenido de IA se correlaciona con las caídas de tráfico en páginas particulares o en subcarpetas particulares.
Empieza por ir a Site Explorer y pegar la URL que quieres analizar. Desde ahí:
- Haz clic en la pestaña del informe Page inspect en la barra lateral izquierda.
- Elige la pestaña Detector de IA.
- Verás tu informe de nivel de contenido de IA en la barra lateral derecha. El texto que nuestro modelo ha detectado como probablemente generado por IA estará codificado por colores según los colores del gráfico circular.
En este ejemplo, nuestro detector de IA ha encontrado una sección de mi post del blog que generé con el modelo GPT-4o de ChatGPT:
Desde ahí, también puedes ver cómo ha cambiado el contenido de la página con el tiempo, cuántos backlinks ha ganado, para cuántas palabras clave se posiciona, cuánto tráfico orgánico estimado recibe…
También puedes probar el modelo a través de nuestra página gratuita del detector de contenido de IA. También estamos añadiendo la detección masiva de contenido de IA al informe de Páginas principales en Site Explorer (próximamente).
Copyleaks
Puntuación: 13/18
URL: https://copyleaks.com/ai-content-detector
Copyleaks igualó la puntuación más alta, mostrando una sólida capacidad de detección en ambos extremos del contenido de IA. Demostró ser especialmente eficaz para detectar la escritura obvia de IA, aunque ocasionalmente titubeó en pasajes mixtos o dudosos.
GPTZero
Puntuación: 12/18
URL: https://gptzero.me
GPTZero ofreció resultados fiables en general, con una clara fortaleza en la detección de contenido con un alto porcentaje de IA. Sin embargo, a veces dudaba en asignar probabilidades de IA seguras a ejemplos de rango medio o híbridos, lo que afectó ligeramente a su precisión total.
Originality.ai
Puntuación: 12/18
URL: https://originality.ai/ai-checker
Originality.ai tuvo un buen rendimiento en la mayoría de los casos, marcando con precisión el texto con mucha IA, pero mostrando una tendencia a sobrestimar la autoría humana cuando se enfrentaba a material generado por IA sutil o bien editado.
Scribbr
Puntuación: 10/18
URL: https://www.scribbr.com/ai-detector/
Scribbr se situó en la mitad de la tabla, manejando razonablemente bien el contenido de IA evidente, pero mostrando una caída en el rendimiento en piezas más matizadas, donde sus predicciones tendían a ser inconsistentes o demasiado cautelosas.
ZeroGPT
Puntuación: 9/18
URL: https://zerogpt.com
El rendimiento de ZeroGPT fue desigual: ocasionalmente acertó con el contenido con mucha IA, pero con frecuencia clasificó erróneamente las muestras con IA parcial y con poca IA. La sensibilidad de la herramienta parecía sesgada hacia los extremos, lo que dio como resultado un perfil menos equilibrado.
Grammarly
Puntuación: 6/18
URL: https://www.grammarly.com/ai-detector
El detector de IA gratuito de Grammarly tuvo dificultades con la detección precisa de IA, ofreciendo predicciones de baja confianza o inexactas en muchos casos. A menudo no reconocía los signos claros de autoría de IA y no era fiable en contenido mixto o dudoso.
Writer
Puntuación: 4/18
URL: https://writer.com/ai-content-detector/
El detector de IA gratuito de Writer obtuvo la puntuación más baja, identificando erróneamente con frecuencia o pasando por alto por completo el material generado por IA. Carecía de precisión en todos los ámbitos y proporcionó poca señal útil incluso cuando se trataba de contenido 100 % escrito por IA.
Todos los detectores de contenido de IA funcionan de la misma manera básica: buscan patrones o anomalías en el texto que parecen ligeramente diferentes de los del texto escrito por humanos.
Para ello, se necesitan dos cosas: muchos ejemplos de texto escrito por humanos y generado por IA para comparar, y un modelo matemático que utilizar para el análisis.
Texto de ejemplo | Frecuencias de palabras | Frecuencias de n-gramas | Estructuras sintácticas | Notas estilísticas |
---|---|---|---|---|
El gato se sentó en la alfombra. Luego el gato bostezó. | el: 3 gato: 2 se sentó: 1 en: 1 la alfombra: 1 luego: 1 bostezó: 1 | Bigramas “el gato”: 2 “gato se sentó”: 1 “se sentó en”: 1 “en la”: 1 “la alfombra”: 1 “luego el”: 1 “gato bostezó”: 1 | Contiene pares S-V (Sujeto-Verbo) como “el gato se sentó” y “el gato bostezó”. | Punto de vista en tercera persona; tono neutro. |
La tabla anterior proporciona ejemplos de los tipos de estructuras de escritura que los detectores de IA pueden identificar. Estos patrones aparecerán de forma diferente entre el contenido generado por IA y el escrito por humanos.
La mayoría de los detectores de IA actuales utilizan redes neuronales, sistemas informáticos que imitan a grandes rasgos el funcionamiento del cerebro humano. Contienen neuronas artificiales y, a través de la práctica (conocida como entrenamiento), las conexiones entre las neuronas se ajustan para mejorar en su objetivo previsto: identificar el texto generado por IA.
Incluso los modelos pequeños pueden hacer un buen trabajo en la detección de IA, siempre que se entrenen con suficientes datos (al menos unos pocos miles de ejemplos).
En la literatura académica, los detectores de IA alcanzan habitualmente tasas de éxito de detección del 80 % (o superiores). Pero todos los detectores de IA son modelos estadísticos. Se basan en probabilidades, no en certezas y, como demuestran nuestras pruebas, pueden ser increíblemente precisos, pero siempre conllevan el riesgo de errores y falsos positivos.
Lecturas adicionales
- ¿Cómo funcionan los detectores de contenido de IA? Respuestas de un científico de datos
- ¿Qué sentido tienen los detectores de IA?
- El 74 % del nuevo contenido web incluye contenido de IA (estudio de 900.000 páginas)
Todos los detectores de IA, incluidos los de mejor rendimiento en esta prueba, el detector de IA de Ahrefs y Copyleaks, comparten las mismas limitaciones principales:
- El contenido de IA muy editado o “humanizado” puede eludir la detección. La edición del contenido generado por IA interrumpe los patrones de escritura generados por máquinas que los detectores de IA utilizan para identificar el contenido de IA.
- Las versiones gratuitas o básicas a menudo carecen de funciones avanzadas y pueden tener una precisión menor. También se requieren actualizaciones periódicas para que los detectores de IA se mantengan al día con las nuevas técnicas de escritura y evasión de la IA. La eficacia de la detección puede variar en función del modelo de IA o del idioma utilizado.
- Los detectores pueden tener dificultades con el contenido escrito en idiomas o formatos menos comunes. La mayoría de los modelos de detección están entrenados en un tipo específico de contenido, o en un idioma específico, y el contenido que queda fuera de estos será más difícil de probar con precisión.
- No siempre hay respuestas claras. A medida que los flujos de trabajo de escritura incorporan la IA de formas más sutiles y matizadas, se vuelve más difícil responder a la pregunta “¿está esto generado por IA?”. ¿Algo está generado por IA si fue escrito por un humano pero corregido por IA? ¿O esbozado por IA pero escrito por un humano? Estas son líneas cada vez más borrosas.
Esto es importante porque muy pocas empresas publican contenido de IA “puro”. En nuestro informe de investigación, El estado de la IA en el marketing de contenidos, descubrimos que solo el 4,04 % de todo el contenido publicado era contenido de IA sin editar. Casi todo el contenido de IA contiene cierta cantidad de edición humana, y eso puede dificultar la detección de IA:
Debido a estas limitaciones, es importante utilizar los detectores de IA de una manera justa y ética. Recomiendo seguir estas mejores prácticas para la detección de contenido de IA, escritas en colaboración con los científicos de datos que desarrollaron nuestro modelo de detección de IA:
- Intenta aprender todo lo posible sobre los datos de entrenamiento del detector y utiliza modelos entrenados con material similar al que quieres probar.
- Prueba varios documentos del mismo autor. ¿El artículo de un escritor fue marcado como generado por IA? Pasa todo su trabajo anterior por la misma herramienta para tener una mejor idea de su tasa base.
- Nunca utilices detectores de contenido de IA para tomar decisiones que afecten a la carrera profesional o académica de alguien. Utiliza siempre sus resultados junto con otras formas de evidencia.
- Úsalo con una buena dosis de escepticismo. Ningún detector de IA es 100 % preciso. Siempre habrá falsos positivos.
Reflexiones finales
Utilizamos nuestro detector de IA para analizar 900.000 páginas web publicadas en abril de 2025 y descubrimos que el 74 % incluía contenido generado por IA.
Está claro que el contenido de IA no va a desaparecer, por lo que es una buena idea utilizar una herramienta como el detector de IA de Ahrefs para comprender cómo afecta el contenido de IA al rendimiento de tu sitio web. Para empezar, dirígete a Site Explorer.
¿Tienes preguntas? Estamos en X y en LinkedIn.