En el contexto de la evolución de los modelos de lenguaje a gran escala (LLMs), un desarrollo innovador ha surgido en la intersección de la inteligencia artificial generativa y la robótica. Este avance fue presentado en la AWS re:Invent 2024 Builders Fair, donde se desarrolló un juego llamado RoboTic-Tac-Toe, diseñado para mostrar cómo estos modelos pueden aplicarse en tiempo real para controlar robots físicos.
RoboTic-Tac-Toe es un juego interactivo en el que dos robots físicos se mueven sobre un tablero de tres en raya, coordinados por LLMs que gestionan tanto el desarrollo de estrategias de juego como los movimientos de los robots. Los jugadores tienen la posibilidad de controlar a los robots mediante comandos en lenguaje natural, guiándolos para que coloquen sus marcadores en el tablero. Los participantes pueden elegir entre competir contra otro jugador, medirse con un LLM o observar cómo dos modelos de IA compiten de manera autónoma.
Este juego se basa en una arquitectura que integra varios servicios de AWS, como Amazon Bedrock, AWS IoT Core y AWS Lambda, eliminando la necesidad de secuencias preprogramadas. En su lugar, la inteligencia artificial genera instrucciones descriptivas en tiempo real, lo que permite una experiencia de juego fluida.
Desde el punto de vista del hardware, el proyecto incluye un tablero de juego con indicadores LED y robots controlados por Raspberry Pi que están equipados con módulos infrarrojos y de radiofrecuencia. Un sistema de visión con una cámara Raspberry Pi permite analizar la posición de los robots y el estado del tablero, asegurando una jugabilidad precisa.
El software detrás del juego utiliza AWS Lambda para invocar el agente supervisor, que orquesta la lógica del juego y gestiona las interacciones entre los diferentes componentes del sistema. Gracias a las capacidades de visión por computadora impulsadas por OpenCV, el juego puede rastrear la posición y orientación de los robots en el tablero, permitiendo que los movimientos sean validados de manera efectiva.
La interacción entre el agente supervisor y los distintos agentes especializados (como el agente de movimiento y el agente de juego) se realiza de forma fluida, garantizando que cada acción se ejecute de acuerdo a la estrategia actual del juego y la posición de los robots. Este sistema no solo ofrece una experiencia de juego emocionante, sino que también ejemplifica cómo la inteligencia artificial y la robótica pueden trabajar juntas para crear aplicaciones interactivas y educativas en el futuro.
Con RoboTic-Tac-Toe, el potencial de la IA generativa alcanzando el mundo físico se hace evidente, y el proyecto promete ser un precursor de futuras innovaciones en el ámbito del entretenimiento y la educación, donde la interacción entre humanos y máquinas seguirá evolucionando.
vía: AWS machine learning blog

