Volver al Blog

Project Glasswing y Claude Mythos Preview: Cómo la IA Encuentra Vulnerabilidades que Humans No Ven

27 de mayo de 202611 min de lectura·Nicolas Farchica

En el primer mes de operación, Claude Mythos Preview escaneó más de 1,000 proyectos open source y encontró 6,202 vulnerabilidades críticas. El 90.6% eran reales — no falsos positivos. El 99% todavía no estaba parcheado.

Esos son los números que Anthropic publicó el 22 de mayo de 2026 en el primer update de Project Glasswing.

En Firefox encontró 271 exploits funcionales. Opus 4.6, el modelo más potente disponible públicamente, encontró 2 en el mismo contexto. Cloudflare, uno de los proveedores de infraestructura más críticos de internet, tenía 2,000 vulnerabilidades que nadie había detectado.

Eso es lo que hace Mythos. Y explica por qué el acceso no es público.


Qué es Project Glasswing

Project Glasswing es el programa de ciberseguridad ofensiva de Anthropic. Está diseñado para encontrar y documentar vulnerabilidades de seguridad en software crítico usando IA como agente principal de análisis.

El nombre es una referencia a la mariposa glasswing — un insecto con alas casi completamente transparentes que puede moverse entre entornos sin ser detectado. Una metáfora bastante directa sobre lo que el programa intenta hacer en sistemas de software.

Lo que Glasswing NO es: un servicio comercial, un bug bounty program, ni una herramienta disponible para el público. Es un programa de investigación restringido a organizaciones partner con uso estrictamente defensivo.

Claude Security Suite es el componente de herramientas que acompaña a Glasswing — un conjunto de capacidades de análisis de seguridad que Anthropic desarrolló en paralelo y que eventualmente va a integrarse en Claude Code.


Qué es Claude Mythos Preview

Claude Mythos Preview es el modelo especializado en ciberseguridad que Anthropic anunció el 22 de mayo de 2026.

Hay un punto importante de contexto: existe confusión entre el "Claude Mythos" filtrado en marzo de 2026 y el "Claude Mythos Preview" anunciado oficialmente en mayo. No son lo mismo.

  • El modelo filtrado en marzo era descrito en documentos internos como "by far the most powerful AI model we've ever developed" — un modelo general tier por encima de Opus.
  • Claude Mythos Preview es un modelo especializado en análisis de seguridad, construido sobre esa misma arquitectura de base pero finetuneado específicamente para razonamiento en vulnerabilidades.

Mythos Preview no está disponible por API ni por claude.ai. Solo existe acceso para organizaciones partner dentro del programa Project Glasswing, con uso restringido a aplicaciones defensivas.

La fecha de lanzamiento más amplio que Anthropic indicó es late June / July 2026, directamente integrado a Claude Code.


Los números del primer mes

Los datos del primer update de Glasswing son los más concretos que Anthropic publicó hasta ahora sobre las capacidades reales de Mythos:

MétricaNúmero
Proyectos open source escaneados1,000+
Vulnerabilidades críticas encontradas6,202
Confirmadas como reales (no falsos positivos)90.6%
Sin parchar a la fecha del reporte99%
Exploits funcionales en Firefox271
Exploits funcionales de Opus 4.6 en el mismo contexto2
Vulnerabilidades encontradas en Cloudflare2,000

El número que más llama la atención no es el 6,202. Es el 90.6% de tasa de confirmación.

Las herramientas de análisis estático automático típicamente tienen tasas de falsos positivos muy altas — encontrar un bug potencial es diferente a confirmar que es exploitable. Mythos no solo identifica vectores posibles: construye el proof of concept, lo ejecuta, y confirma que funciona. Eso es lo que explica esa tasa.

Y el 99% sin parchar no es negligencia de los mantenedores. Es que el ciclo normal de disclosure responsable toma semanas o meses, y estos resultados son de un solo mes de operación.


Los bugs que esperaban décadas

Tres hallazgos específicos que Anthropic documentó en el primer update de Glasswing ilustran exactamente qué tipo de vulnerabilidades estaba encontrando:

CVE-2026-5194 — wolfSSL

wolfSSL es una librería de TLS ampliamente usada en sistemas embebidos, IoT, y aplicaciones donde el tamaño importa. La vulnerabilidad que Mythos encontró permite falsificar certificados TLS — crear certificados que los sistemas consideran válidos pero que no lo son.

El impacto práctico: se pueden construir sitios bancarios o de pago que los navegadores presentan como seguros (candado verde, HTTPS) sin que lo sean. Mythos no solo encontró el bug — construyó el exploit completo.

OpenBSD TCP SACK — 27 años en producción

OpenBSD es considerado por la comunidad de seguridad como uno de los sistemas operativos más seguros que existen. El proyecto tiene un historial de auditorías de código rigurosas y un modelo de desarrollo donde la seguridad es primero.

Mythos encontró un desbordamiento de buffer en el manejo de TCP SACK (Selective Acknowledgment) que estaba en producción desde 1997. 27 años. Nunca detectado por herramientas automáticas. Nunca señalado en las múltiples auditorías manuales que el proyecto OpenBSD condujo en ese período.

FFmpeg H.264 — 16 años, invisible para fuzzing

FFmpeg es la librería de multimedia más usada en el mundo. Está en reproductores de video, plataformas de streaming, sistemas de videoconferencia, navegadores.

El decodificador H.264 de FFmpeg tiene una vulnerabilidad que 5 millones de intentos de fuzzing no detectaron. El fuzzing — la técnica de generar inputs aleatorios o semi-aleatorios para encontrar crashes — es la herramienta estándar de la industria para encontrar este tipo de bugs. Mythos lo encontró en su primer análisis.

Estos tres ejemplos comparten una característica: son vulnerabilidades que requieren entender profundamente el comportamiento del sistema, razonar sobre condiciones de borde no obvias, y construir hipótesis que las herramientas automáticas de análisis no pueden formular. Ese es exactamente el tipo de razonamiento que Mythos está diseñado para hacer.


Cómo funciona el método

El "prompt" que inicia un análisis de Glasswing es deliberadamente simple:

"encontrá una vulnerabilidad de seguridad"

Lo que Mythos hace con eso es un proceso de cuatro pasos:

Paso 1 — Clasificación de riesgo: Lee el código fuente del proyecto y clasifica cada archivo en una escala de 1 a 5 según el riesgo potencial. Archivos de parsing, manejo de memoria, red, y autenticación reciben prioridad alta.

Paso 2 — Experimentación activa: No analiza el código estáticamente. Ejecuta el proyecto, agrega logs de debug, construye hipótesis sobre comportamiento anómalo. Es análisis dinámico, no estático.

Paso 3 — Construcción del POC: Cuando identifica un vector potencial, construye el proof of concept. No reporta un "posible problema" — confirma que el exploit funciona.

Paso 4 — Validación independiente: Un segundo agente Mythos revisa el hallazgo de forma independiente. No tiene acceso al análisis del primer agente. Tiene que llegar a la misma conclusión por su propio camino.

El paso 4 es lo que explica el 90.6% de tasa de confirmación. Si dos instancias independientes del modelo, analizando el mismo código sin compartir contexto, llegan a la misma conclusión de que el exploit es válido, la probabilidad de falso positivo baja dramáticamente.

Este método también fue el que Mythos usó en un ejercicio de red team interno de Anthropic donde penetró una red corporativa simulada en 32 pasos — la primera vez que se logra en ese tipo de ejercicio en CTF history.


El cuello de botella real: remediación, no discovery

El problema que Glasswing expone no es que la industria sea incapaz de encontrar bugs. Es que el cuello de botella es la remediación.

Las herramientas automáticas de análisis estático (SAST) ya generan miles de alertas por proyecto. El problema siempre fue la señal-ruido: la mayoría son falsos positivos, y los equipos de seguridad se abruman revisando alertas que no llevan a ningún lado.

Mythos invierte esa ecuación. Con 90.6% de tasa de confirmación, cada hallazgo es casi con certeza real. Y con la escala de operación — 6,202 vulnerabilidades confirmadas en un mes — el problema pasa a ser otro: ¿cómo priorizás qué parchar primero?

Los datos del primer update de Glasswing sobre el ciclo de disclosure son reveladores:

MétricaNúmero
Bugs reportados con disclosure responsable100%
Parcheados en los primeros 30 días75
Período estándar de disclosure90 días

75 bugs parcheados en 30 días sobre más de 6,000 encontrados. No es que los mantenedores sean lentos — es que el volumen de hallazgos supera cualquier capacidad razonable de respuesta.

Anthropic está reportando activamente con los mantenedores de cada proyecto bajo el modelo estándar de 90 días de disclosure. Pero la aritmética del problema es clara: si la tasa de discovery de Mythos escala, la brecha entre vulnerabilidades conocidas y vulnerabilidades parcheadas va a crecer antes de achicarse.


Lo que viene: Mythos-1 en Claude Code

Anthropic anunció que Mythos-1 llega a Claude Code en late June / July 2026, junto con Claude Security Suite.

La integración viene con restricciones deliberadas:

  • No es acceso general. Solo organizaciones partner con uso defensivo verificado.
  • No es para usuarios individuales. El acceso está condicionado a estar dentro del programa Glasswing.
  • Solo uso defensivo. Anthropic está siendo explícito sobre esto: Mythos no es una herramienta para encontrar bugs y explotarlos — es para encontrarlos y parchearlos.

Para quienes construimos sobre Claude Code, esto significa que las capacidades de análisis de seguridad que hoy solo tienen las organizaciones partner eventualmente van a estar disponibles como herramientas en el ecosistema. No sé exactamente en qué forma — si como un subagente especializado, como un MCP, o como una skill — pero la integración con Claude Code es el camino que Anthropic indicó.


El contexto más amplio: por qué Anthropic hizo esto

La pregunta que vale hacerse es por qué Anthropic, cuyo posicionamiento central es "AI safety", está construyendo la herramienta de análisis de seguridad ofensiva más avanzada del mundo.

La respuesta que da Anthropic es directa: si Mythos puede encontrar estas vulnerabilidades, alguien más también puede hacerlo — con o sin IA avanzada. La diferencia es que los modelos van a democratizar esas capacidades. En dos años, lo que hoy requiere un investigador senior de seguridad con décadas de experiencia va a estar al alcance de cualquiera con acceso a un modelo suficientemente potente.

El proyecto Glasswing es una apuesta a que es mejor encontrar esas vulnerabilidades primero, reportarlas responsablemente, y parcharlas, que esperar a que alguien con menos escrúpulos lo haga.

Ese argumento tiene lógica. Lo que es más difícil de evaluar es si la infraestructura de disclosure y remediación de la industria tiene capacidad para procesar los hallazgos a la velocidad que Mythos los genera. El primer mes de datos sugiere que no todavía.


Mi opinión

Trabajo con Claude Code todos los días. Construyo sistemas con agentes, MCPs, workflows. Uso Claude para código, análisis, investigación, contenido. Mi opinión sobre Glasswing viene de ese contexto específico.

Lo que más me llama la atención de los resultados no es el número absoluto de vulnerabilidades encontradas. Es el tipo de vulnerabilidades: bugs que llevan décadas en producción, en proyectos con auditorías rigurosas, invisibles para las mejores herramientas automatizadas que existen.

Eso sugiere que Mythos no es solo "fuzzing más rápido" ni "análisis estático con más reglas". Es razonamiento. Está haciendo el tipo de análisis que requiere entender la intención del código, construir hipótesis sobre condiciones de borde no obvias, y explorar caminos de exploración que las herramientas automáticas no pueden formular porque no saben qué preguntar.

Eso es cualitativamente diferente a lo que existía antes.

La restricción de uso defensivo me parece la decisión correcta dado el momento, aunque incompleta como solución de largo plazo. El problema real es la asimetría: encontrar vulnerabilidades con Mythos es rápido y escalable. Parcharlas sigue siendo lento y requiere trabajo humano. Esa brecha no desaparece con más acceso al modelo — requiere que el ecosistema entero de software se adapte a un nuevo ritmo de discovery.

Para los que seguimos de cerca la evolución de Claude Code, Glasswing es la señal más clara hasta ahora de lo que viene cuando Mythos llegue al ecosistema. Si el análisis de seguridad que hoy hace en modo restringido eventualmente está disponible como herramienta en Claude Code, cambia completamente lo que es posible construir en el espacio de seguridad, auditoría, y compliance.

El lanzamiento de Mythos-1 en Claude Code es el evento que más espero en el ecosistema Anthropic en los próximos meses. Cuando haya acceso real, con documentación técnica y API disponible, va a haber mucho más para analizar.


Si construís sobre Claude Code y querés entender cómo funciona la arquitectura del ecosistema que está detrás de todo esto, los subagentes en Claude Code y el sistema CLAUDE.md son el punto de entrada más útil. Es la misma arquitectura que Mythos usa para orquestar sus análisis de seguridad.

NF

Nicolas Farchica

Especialista Claude Code

Argentino en Copenhague. Construyo sistemas de agentes IA con Claude Code — agentes, MCP servers y automatizaciones en producción.

Seguir en LinkedIn

¿Te resultó útil?

Suscribite para recibir más guías de Claude Code y agentes IA.

Artículos relacionados