domingo, abril 19, 2026
  • Intrant 970x90

Microsoft desarrolla la IA que les falta a la mayoría de robots: la capacidad de decidir bien

  • banner vida interior

La robótica avanza rápidamente, pero la mayoría de los robots sigue enfrentando una limitación fundamental: la dificultad para tomar decisiones precisas sobre qué acción realizar y dónde llevarla a cabo. Microsoft, junto a un consorcio de investigadores académicos, ha presentado un nuevo estándar, GroundedPlanBench, que busca resolver este desafío y acercar la inteligencia artificial de los robots a la toma de decisiones eficiente y contextualizada.

En los sistemas robóticos convencionales, el proceso de decisión se divide en dos etapas. Primero, un modelo de visión y lenguaje genera un plan en lenguaje natural. Después, otro sistema traduce ese plan en acciones físicas. Este enfoque fragmentado provoca errores frecuentes, ya que la desconexión entre el plan y la ejecución permite que las equivocaciones en una etapa se trasladen a la siguiente.

Errores típicos incluyen confusiones sobre qué objeto manipular o la invención de pasos innecesarios. Por ejemplo, si se le pide a un robot descartar vasos de papel, puede no identificar correctamente cuál vaso debe recoger o incluso realizar acciones no solicitadas. Estas fallas se agravan en entornos desordenados, donde los objetos son similares o numerosos.

Recomendamos leer:OpenAI cerrará Sora, su plataforma de generación de videos con IA

GroundedPlanBench: un nuevo estándar para mejorar la toma de decisiones

Para enfrentar este desafío, Microsoft y sus socios han desarrollado GroundedPlanBench, un sistema que evalúa si los modelos de IA pueden planificar tareas y, al mismo tiempo, identificar con precisión dónde debe realizarse cada acción.

A diferencia de los sistemas tradicionales que solo utilizan texto, este estándar vincula cada acción a una ubicación específica en una imagen. Acciones como agarrar, colocar, abrir o cerrar se asocian a objetos o posiciones determinadas, obligando a la IA a conectar la decisión con el entorno físico real.

El benchmark incluye más de mil tareas basadas en interacciones reales de robots. Algunas instrucciones son directas, como colocar una cuchara en un plato, mientras que otras son abiertas, como ordenar una mesa. Esta variedad es crucial, ya que los robots suelen fallar cuando las indicaciones no son lo suficientemente claras.

En uno de los experimentos, un robot debía colocar cuatro servilletas en un sofá. La falta de especificidad en la instrucción hizo que el sistema repitiera la acción sobre la misma servilleta, incluso con descripciones aparentemente más precisas como “servilleta superior izquierda”. Esto evidencia que el lenguaje ambiguo sigue representando un obstáculo para la ejecución fiable de tareas complejas.

Aprendizaje basado en tareas reales

Para mejorar la capacidad de decisión, el equipo desarrolló un método de entrenamiento denominado Video-to-Spatially Grounded Planning (V2GP). Este sistema analiza videos de robots realizando tareas, detecta las interacciones con objetos, identifica dichos objetos y rastrea sus ubicaciones, generando así planes estructurados que vinculan cada acción con un punto específico.

Mediante este enfoque, los investigadores generaron más de 40.000 planes “arraigados”, que van desde acciones simples hasta secuencias complejas de hasta 26 pasos. Los modelos entrenados con este método demostraron una mejor capacidad para elegir acciones adecuadas y asociarlas con los objetos correctos, además de reducir errores repetitivos como actuar varias veces sobre el mismo elemento.

Un cambio de paradigma para la robótica

Pese a los avances, los retos persisten, especialmente en tareas largas y con instrucciones indirectas. Los investigadores advierten que los modelos deben ser capaces de razonar sobre secuencias extensas y mantener la coherencia a lo largo de múltiples pasos. Al comparar el nuevo enfoque con los sistemas tradicionales, se observó que estos últimos tienden a asignar múltiples acciones al mismo objeto o lugar, sobre todo cuando las órdenes son ambiguas.

La integración de planificación y localización en un único proceso reduce estos desajustes y permite decisiones más precisas. El equipo de Microsoft sugiere que futuras investigaciones podrían combinar este método con modelos predictivos capaces de anticipar las consecuencias de cada acción, lo que ayudaría a los robots a evitar errores en tiempo real.

También puedes leer:Un proyecto europeo definirá un código ético de la IA en la educación y políticas públicas

Las conclusiones del estudio apuntan a una dirección clara para el futuro de la robótica: los sistemas que consideran de manera conjunta la acción y la ubicación tienen más probabilidades de operar con éxito en ambientes reales. Esta innovación representa un paso clave para que los robots puedan decidir y actuar de manera fiable en tareas cotidianas, acercándolos a una verdadera inteligencia artificial aplicada.

En el foco

  • Revisa tu celular antes de comprar

  • Nueva Cedula

  • banner punto vida interior y policia

Explora más

UFHEC presenta 21 proyectos de investigación enfocados en salud, innovación y desarrollo sostenible en RD

Redacción.- La Universidad Federico Henríquez y Carvajal (UFHEC) impulsa un total de 21 propuestas de investigación en el marco del Fondo Nacional de Innovación y Desarrollo Científico y Tecnológico (FONDOCyT) 2026, en campos vinculados a salud, sostenibilidad ambiental, producción agroalimentaria, innovación tecnológica y políticas públicas, alineados con desafíos prioritarios de la República Dominicana. El rector […]

Descubren en Noruega partes de un barco sepultado que antecede a los vikingos

El hallazgo en Leka invita a pensar que en el norte de Europa existían rituales funerarios sofisticados mucho antes de lo que se pensaba. Cómo se organizaban y vivían esas sociedades

Spotify gana demanda por USD 322 millones contra sitio pirata

Spotify ha obtenido una contundente victoria judicial contra Anna’s Archive, un sitio de piratería musical que fue condenado a pagar 322 millones de dólares tras extraer y publicar gran parte del catálogo de la plataforma de streaming. El fallo, emitido por un tribunal federal de Nueva York, también beneficia a tres grandes discográficas y marca un capítulo clave en la […]

Anthropic lanza un nuevo modelo de IA con funciones de ciberseguridad restringidas

Nueva York .- La empresa de inteligencia artificial Anthropic anunció este jueves el lanzamiento de su nuevo modelo, Claude Opus 4.7, una versión que mejora sustancialmente las capacidades de ingeniería de software y razonamiento de su predecesor, pero que llega con restricciones deliberadas en sus funciones de ciberseguridad. El lanzamiento de Opus 4.7 se produce […]

El comandante de Artemis II dice que el inodoro "fue maravilloso", pero falló la ventilación

Miami.- El comandante de la misión Artemis II a la Luna, el astronauta de la NASA Reid Wiseman, afirmó este jueves que el inodoro que emplearon durante la expedición espacial «fue maravilloso» pese a los problemas que ocasionó, que dijo que estuvieron asociados al sistema de ventilación. «Solo quiero decir, de forma 100 % directa: […]

La NASA revisa el desempeño del escudo térmico de la nave Orión después de la misión Artemis II

Las autoridades aeroespaciales concentran los esfuerzos en revisar el estado del recubrimiento de la nave Orión para determinar su resistencia después del amerizaje, medida que resultará clave en la planificación de futuras misiones hacia la Luna
  • APlicación banner 300x250