Claude Mythos: todo lo que sabemos hasta ahora del modelo llamado a cambiar la IA en 2026
El mundo no está preparado aún para esta IA, dice Anthropic
La “filtración” ya es una realidad, Anthropic ha presentado su nuevo modelo de inteligencia artificial, uno que, según dicen, es tan peligroso que no pueden liberarlo al público general. Su nombre es Claude Mythos y promete ser el modelo del que más vamos a hablar este 2026 gracias a todo lo que puede hacer, o al menos lo que hasta ahora le han permitido.
Claramente, Claude Mythos no es un modelo cualquiera para Anthropic. Específicamente se le considera un modelo de frontera (o ‘frontier model’, como le llaman sus creadores en su idioma original), y lo que ha presentado Anthropic hasta ahora es una “Research Preview”. Mythos es tan importante y grande para la casa de Dario Amodei que han pasado de usar su nomenclatura tradicional basada en la poesía (Haiku, Opus…) y directamente le han puesto un nombre que lo diferencia.
¿Pero qué lo hace tan importante?
Bueno, en primer lugar, todo lo que ha demostrado en materia de ciberseguridad.
Según las revelaciones de Anthropic, Mythos puede ser un antes y un después en cuanto a la detección de vulnerabilidades y creación de parches de seguridad. El modelo ya ha identificado “miles de errores” en sistemas operativos y navegadores, incluyendo fallos que no habían sido detectados durante décadas. En concreto, ha detectado un fallo de 27 años en OpenBSD y un error de FFmpeg de hace 16 años.
Anthropic dice que el mundo no está listo para Mythos, y por ello no van a liberar un modelo para los usuarios generales hasta nuevo aviso.
Lo que dice Anthropic, como cuentan en The Guardian, es que sienten una gran responsabilidad sobre este modelo y por ello no van a liberarlo al público. Por supuesto, sabemos que este tipo de comunicados y alarmas también pueden formar parte de una campaña de marketing, pensada ya sea para mantener una exclusividad y restricciones (y hay quienes dicen que este podría ser el caso con Mythos), o simplemente para cobrar más caro.
El hecho es que en este caso hablamos de la detección de vulnerabilidades y exploits con una gran precisión, y por ello los atacantes, los cibercriminales y hackers, podrían usar Mythos para encontrar y explotar estas vulnerabilidades en sistemas importantes como redes eléctricas y de suministro de agua, en sistemas operativos y más. Es por esto que Anthropic se niega, al menos hasta ahora, a liberarlo al público.
“Hemos visto que Mythos Preview puede escribir exploits en pocas horas, algo que a los humanos le habría tomado semanas desarrollar”, dicen en un detallado artículo llamado “Assessing Claude Mythos Preview’s Cybersecurity Capabilities”, o “Evaluación de las capacidades de ciberseguridad de Claude Mythos Preview”, en la lengua de Cervantes.
Como comentamos en el podcast, el gran cambio que esto supone es que por primera vez un modelo (de los grandes) no va a estar disponible para el público general por motivos de seguridad. Es interesante porque por primera vez en años ahora existe una brecha significativa entre los modelos disponibles públicamente y los privados.
Porque aunque Mythos Preview no está disponible para el público, sí que lo está para un selecto grupo de empresas y organizaciones. Anthropic ha creado una coalición industrial llamada Proyecto Glasswing de la que forman parte AWS, Apple, Google, Microsoft, NVIDIA, JPMorgan, Cisco, CrowdStrike, Palo Alto Networks, la Linux Foundation y otros. Lo que buscan con esta coalición es “parchear” todo el software antes de lanzarlo. Según la compañía de Amodei, miles de vulnerabilidades se están solucionando en este momento.
Por supuesto, no deja de llamarnos la atención y hacernos arquear una ceja que una empresa privada ahora posee acceso o conocimiento de exploits de día cero muy potentes en incontables proyectos de software y sistemas.
El gran salto de Claude Mythos
Los resultados en los benchmarks de Mythos dejan claro que este modelo da un salto importante en la programación agéntica. Según Anthropic, Mythos ha alcanzado un 77,8% en el benchmark SWE Bench Pro, un gran avance en comparación al 54% de Opus 4.6. También ha logrado un 94% en SWE Bench Verified y en general ha sido un salto considerable en todas las pruebas de rendimiento a las que fue sometido.
En las pruebas de Anthropic, Mythos fue sometido a un entorno aislado y logró salir de él tras crear “un exploit de varios pasos moderadamente sofisticado” para obtener acceso a internet, y le envió un correo electrónico a un investigador que estaba encargado de la prueba.
Anthropic dice que Mythos Preview es un modelo mucho más obediente, su alineamiento es muchísimo mejor que en modelos y versiones anteriores de Claude. Esto significa que obedece mucho mejor y al pie de la letra lo que le pide un humano, y los resultados son más acordes a ello. Pero curiosamente, esto también lo podría hacer un riesgo mayor en las manos equivocadas, según Anthropic, y la prueba de ello es cómo logró escapar del entorno aislado en la prueba que mencionamos algunas líneas atrás. En este caso, Mythos Preview no solo logró escapar siguiendo las instrucciones del investigador, sino que también, para demostrar su éxito, publicó los detalles del exploit que creó para escapar en algunas páginas web, sin que nadie se lo pidiera.
Así que estamos ante un salto importante en cuanto a la IA agéntica, con Claude Mythos como un modelo más potente y más avanzado, pero también más peligroso. Sin embargo, podemos arriesgarnos a decir que este es el primer modelo que plantea estos riesgos de seguridad, pero no será el último. La pregunta ahora es cuándo veremos una versión abierta equivalente a Mythos, y qué medidas de seguridad van a tomar las grandes empresas de tecnología y software (y no nos olvidemos de los gobiernos) antes de que esté disponible.
Más temas que debatimos en el último episodio del podcast:
Gemma 4
Seedance 2.0
Claude Mythos es increíblemente eficiente
Debimos tirar más fotos y construir más datacenters
La lucha contra el AI Slopacalypse no ha hecho sino empezar
Monos Estocásticos está disponible en YouTube, Spotify, iVoox y Cuonda.






