DeepMind, World Labs y Meta revolucionan robótica con simulación ambiental
Los world models representan una frontera fundamental en la inteligencia artificial: la capacidad de entender y predecir cómo funciona el mundo físico. Estos sistemas prometen dar a los sistemas de IA la capacidad de entender sus entornos sin necesidad de datos etiquetados por humanos o texto generado por humanos, un cambio radical en cómo entrenamos sistemas de IA.
Con world models, los sistemas de IA pueden responder mejor a eventos impredecibles y fuera de distribución, y volverse más robustos contra la incertidumbre del mundo real. Más importante aún, los world models abren el camino para sistemas de IA que pueden ir más allá del texto y resolver tareas que implican entornos físicos complejos.
DeepMind está construyendo Genie, una familia de modelos generativos end-to-end que simulan un entorno para que un agente pueda predecir cómo evolucionará el entorno y cómo las acciones lo cambiarán. Toma una imagen o prompt junto con acciones del usuario y genera la secuencia de fotogramas de video que reflejan cómo cambia el mundo. Este enfoque permite que los sistemas aprendan dinámicas físicas de manera unsupervised.
World Labs, una nueva startup fundada por la pionera de IA Fei-Fei Li, toma un enfoque ligeramente diferente. Marble, el primer sistema de IA de World Labs, utiliza IA generativa para crear un modelo 3D a partir de una imagen o prompt, que luego puede ser utilizado por un motor de física y 3D para renderizar y simular el entorno interactivo utilizado para entrenar robots. Este método permite la creación rápida de entornos de simulación realistas.
Otro enfoque es la Joint Embedding Predictive Architecture (JEPA) defendida por Yann LeCun. Los modelos JEPA aprenden representaciones latentes de datos sin procesar para que el sistema pueda anticipar qué viene después sin generar cada píxel. Esta arquitectura es más eficiente computacionalmente que generar fotogramas completos.
Las implicaciones de los world models son profundas. Permiten que los robots aprendan a través de simulación antes de interactuar con el mundo real, reduciendo significativamente los costos de entrenamiento. También permiten que los sistemas de IA razonen sobre escenarios contrafácticos y planifiquen acciones futuras de manera más efectiva.
La convergencia de world models con robótica está creando una nueva era de sistemas autónomos que pueden navegar y manipular el mundo físico con mayor precisión y adaptabilidad que nunca antes.
¿Quieres probar Manus AI?
Experimenta el poder de los agentes de IA autónomos. Obtén acceso gratuito con nuestra invitación exclusiva.
Obtener Acceso Gratuito