Claude Mythos: todo lo que sabemos hasta ahora del modelo llamado a cambiar la IA en 2026

El mundo no está preparado aún para esta IA, dice Anthropic

abr 13, 2026

La “filtración” ya es una realidad, Anthropic ha presentado su nuevo modelo de inteligencia artificial, uno que, según dicen, es tan peligroso que no pueden liberarlo al público general. Su nombre es Claude Mythos y promete ser el modelo del que más vamos a hablar este 2026 gracias a todo lo que puede hacer, o al menos lo que hasta ahora le han permitido.

Claramente, Claude Mythos no es un modelo cualquiera para Anthropic. Específicamente se le considera un modelo de frontera (o ‘frontier model’, como le llaman sus creadores en su idioma original), y lo que ha presentado Anthropic hasta ahora es una “Research Preview”. Mythos es tan importante y grande para la casa de Dario Amodei que han pasado de usar su nomenclatura tradicional basada en la poesía (Haiku, Opus…) y directamente le han puesto un nombre que lo diferencia.

¿Pero qué lo hace tan importante?

Bueno, en primer lugar, todo lo que ha demostrado en materia de ciberseguridad.

Según las revelaciones de Anthropic, Mythos puede ser un antes y un después en cuanto a la detección de vulnerabilidades y creación de parches de seguridad. El modelo ya ha identificado “miles de errores” en sistemas operativos y navegadores, incluyendo fallos que no habían sido detectados durante décadas. En concreto, ha detectado un fallo de 27 años en OpenBSD y un error de FFmpeg de hace 16 años.

Anthropic dice que el mundo no está listo para Mythos, y por ello no van a liberar un modelo para los usuarios generales hasta nuevo aviso.

Antonio Ortiz@antonello

Con el anuncio de Claude Mythos, su potencial para la ciberseguridad (para atacar y para defender) y la decisión de Anthropic de controlar mucho su acceso vuelve el momento GPT-2, "esta IA es demasiado, el mundo no está preparado"

Anthropic @AnthropicAI

Introducing Project Glasswing: an urgent initiative to help secure the world’s most critical software. It’s powered by our newest frontier model, Claude Mythos Preview, which can find software vulnerabilities better than all but the most skilled humans. https://t.co/NQ7IfEtYk7

8:36 PM · Apr 7, 2026 · 1.9K Vistas

2 Respuestas · 1 Republicar · 11 Me gusta

Lo que dice Anthropic, como cuentan en The Guardian, es que sienten una gran responsabilidad sobre este modelo y por ello no van a liberarlo al público. Por supuesto, sabemos que este tipo de comunicados y alarmas también pueden formar parte de una campaña de marketing, pensada ya sea para mantener una exclusividad y restricciones (y hay quienes dicen que este podría ser el caso con Mythos), o simplemente para cobrar más caro.

El hecho es que en este caso hablamos de la detección de vulnerabilidades y exploits con una gran precisión, y por ello los atacantes, los cibercriminales y hackers, podrían usar Mythos para encontrar y explotar estas vulnerabilidades en sistemas importantes como redes eléctricas y de suministro de agua, en sistemas operativos y más. Es por esto que Anthropic se niega, al menos hasta ahora, a liberarlo al público.

“Hemos visto que Mythos Preview puede escribir exploits en pocas horas, algo que a los humanos le habría tomado semanas desarrollar”, dicen en un detallado artículo llamado “Assessing Claude Mythos Preview’s Cybersecurity Capabilities”, o “Evaluación de las capacidades de ciberseguridad de Claude Mythos Preview”, en la lengua de Cervantes.

Como comentamos en el podcast, el gran cambio que esto supone es que por primera vez un modelo (de los grandes) no va a estar disponible para el público general por motivos de seguridad. Es interesante porque por primera vez en años ahora existe una brecha significativa entre los modelos disponibles públicamente y los privados.

Porque aunque Mythos Preview no está disponible para el público, sí que lo está para un selecto grupo de empresas y organizaciones. Anthropic ha creado una coalición industrial llamada Proyecto Glasswing de la que forman parte AWS, Apple, Google, Microsoft, NVIDIA, JPMorgan, Cisco, CrowdStrike, Palo Alto Networks, la Linux Foundation y otros. Lo que buscan con esta coalición es “parchear” todo el software antes de lanzarlo. Según la compañía de Amodei, miles de vulnerabilidades se están solucionando en este momento.

Por supuesto, no deja de llamarnos la atención y hacernos arquear una ceja que una empresa privada ahora posee acceso o conocimiento de exploits de día cero muy potentes en incontables proyectos de software y sistemas.

El gran salto de Claude Mythos

Los resultados en los benchmarks de Mythos dejan claro que este modelo da un salto importante en la programación agéntica. Según Anthropic, Mythos ha alcanzado un 77,8% en el benchmark SWE Bench Pro, un gran avance en comparación al 54% de Opus 4.6. También ha logrado un 94% en SWE Bench Verified y en general ha sido un salto considerable en todas las pruebas de rendimiento a las que fue sometido.

En las pruebas de Anthropic, Mythos fue sometido a un entorno aislado y logró salir de él tras crear “un exploit de varios pasos moderadamente sofisticado” para obtener acceso a internet, y le envió un correo electrónico a un investigador que estaba encargado de la prueba.

Lisan al Gaib@scaling01

Claude Mythos is insanely token-efficient

6:20 PM · Apr 7, 2026 · 294K Vistas

70 Respuestas · 209 Reenvíos · 3.56K Me gusta

Anthropic dice que Mythos Preview es un modelo mucho más obediente, su alineamiento es muchísimo mejor que en modelos y versiones anteriores de Claude. Esto significa que obedece mucho mejor y al pie de la letra lo que le pide un humano, y los resultados son más acordes a ello. Pero curiosamente, esto también lo podría hacer un riesgo mayor en las manos equivocadas, según Anthropic, y la prueba de ello es cómo logró escapar del entorno aislado en la prueba que mencionamos algunas líneas atrás. En este caso, Mythos Preview no solo logró escapar siguiendo las instrucciones del investigador, sino que también, para demostrar su éxito, publicó los detalles del exploit que creó para escapar en algunas páginas web, sin que nadie se lo pidiera.

Así que estamos ante un salto importante en cuanto a la IA agéntica, con Claude Mythos como un modelo más potente y más avanzado, pero también más peligroso. Sin embargo, podemos arriesgarnos a decir que este es el primer modelo que plantea estos riesgos de seguridad, pero no será el último. La pregunta ahora es cuándo veremos una versión abierta equivalente a Mythos, y qué medidas de seguridad van a tomar las grandes empresas de tecnología y software (y no nos olvidemos de los gobiernos) antes de que esté disponible.

Más temas que debatimos en el último episodio del podcast:

Gemma 4
Seedance 2.0
Claude Mythos es increíblemente eficiente
Debimos tirar más fotos y construir más datacenters
La lucha contra el AI Slopacalypse no ha hecho sino empezar

Monos Estocásticos está disponible en YouTube, Spotify, iVoox y Cuonda.

Edgar Otero

Apr 17

Después de todo, me quedo con esto:

"El mundo no está preparado aún para esta IA, dice Anthropic". La clave está en quién lo dice.

Es evidente que no hay forma de desplegar esto masivamente, así que es mejor decir que lo haces por responsabilidad. La carta de la IA responsable juega a favor del relato de Anthropic. Como si Claude no se hubiera usado ya para planificar operaciones militares algo dudosas.

Hablaba un poco sobre esto aquí:

https://www.edgarotero.es/p/claude-mythos

Responder

monos estocásticos

Discusión sobre este post

Por supuesto, sigue adelante.