Qué es Fable 5: el nuevo modelo de IA de Anthropic basado en Mythos con fuertes restricciones por seguridad

Anthropic abrió por primera vez al manifiesto el acercamiento a Fable 5, una interpretación derivada de su modelo más progresista de inteligencia sintético, Mythos, que había generado un cachas revuelo por su capacidad «en la detección y explotación de vulnerabilidades de software», poco que habían listo que podía comprometer a los principales «sistemas operativos y navegadores web». Según la empresa, el modelo escaso ofrece mejoras significativas en programación, examen difícil y visión sintético, aunque mantiene restricciones en áreas sensibles como ciberseguridad, biología y química, donde las respuestas son derivadas automáticamente a otras versiones con mayores salvaguardas.
Hasta ahora, Mythos había permanecido establecido a un corro escaso de organizaciones adecuado a preocupaciones vinculadas a la seguridad. Tras una expansión auténtico a cientos de entidades de infraestructura crítica en 15 países, Anthropic decidió propalar Fable 5 a través de su API y de sus planes corporativos.
El acercamiento será temporalmente de balde para los usuarios de los planes Pro, Max, Team y Enterprise hasta el 22 de junio. A partir del día ulterior, la compañía exigirá créditos de consumo específicos para utilizar el modelo, aunque adelantó que buscará reincorporarlo a las suscripciones tradicionales lo antaño posible.
Introducing Claude Fable 5: a Mythos-class model that we’ve made safe for genérico use.
Its capabilities exceed those of any model we’ve ever made generally available. pic.twitter.com/2AvmEjHIX8
En paralelo, Anthropic incluso comenzó a desplegar Mythos 5, una interpretación aún más avanzadilla reservada para organizaciones previamente autorizadas.
Un extensión impresionado por las preocupaciones sobre la IA
La presentación de Fable 5 llega en un momento esencia para la industria. Coincide con la salida a bolsa de Anthropic y se produce poco posteriormente de que la empresa pidiera a los principales laboratorios del sector coordinar límites al incremento de sistemas cada vez más potentes.
La comparación de Fable 5 con otros modelos del mercado.
La firma advirtió recientemente que la inteligencia sintético podría acercarse a escenarios de auto-mejora recursiva, una capacidad mediante la cual los modelos serían capaces de perfeccionarse de modo autónoma sin intervención humana.
Por ese motivo, Anthropic sometió a Fable 5 a extensas pruebas de seguridad antaño de su extensión. “Internamente, llevamos a cabo un programa externo de recompensas por la detección de errores que no produjo ninguna vulnerabilidad universal tras más de 1000 horas de pruebas. Posteriormente, colaboramos con organizaciones externas de pruebas de penetración (red teaming) que tampoco lograron encontrar vulnerabilidades universales», detallaron sobre el proceso de corroboración antes de lanzarlo al público.
Los salvaguardas del nuevo modelo de Mythos
Como parte de las nuevas medidas de seguridad, Anthropic implementará una política de retención de 30 días para todo el tráfico generado por Fable 5 y Mythos 5, incluso en organizaciones que previamente contaban con acuerdos de almacenamiento cero.
La empresa aseguró que los datos no serán utilizados para entrenamiento, sino únicamente para detectar intentos sofisticados de evasión de restricciones, identificar nuevos jailbreaks (técnica de seguridad informática en la que un usuario utiliza instrucciones engañosas (prompts) para manipular un modelo de lenguajey reducir falsos positivos en los sistemas de seguridad). La decisión podría marcar un precedente en una industria donde los modelos más avanzados exigen cada vez mayores controles sobre el uso de la información.
Según Anthropic, los casos en los que Fable 5 necesita recurrir a Claude Opus 4.8 son poco frecuentes. Los datos preliminares indican que más del 95% de las sesiones se completan utilizando exclusivamente el nuevo modelo.
Entre las evaluaciones externas destacadas por la compañía figura la realizada por Hex, que aseguró que Fable fue el primer sistema en alcanzar un 90% de precisión en su principal benchmark analítico para tareas complejas y de larga duración.
“En las preguntas más difíciles, demuestra un juicio sólido y atención a los matices”, señalaron desde Hex. Otras compañías incluso reportaron mejoras en programación, incremento de aplicaciones completas, diseño de interfaces y creación de videojuegos.
Sin incautación, el costo podría convertirse en una barrera para su apadrinamiento masiva. Anthropic fijó un precio de u$s10 por millón de tokens de entrada y u$s50 por millón de tokens de salida, el doble que Claude Opus 4.8.




