Boston Dynamics, la société spécialisée dans la robotique, a utilisé ChatGPT pour former son chien robot afin de répondre aux questions et génère des réponses sur ses installations.
Vous souvenez-vous de Spot ? Le robot à quatre pattes de Boston Dynamics capable de courir, sauter, grimper des escaliers et même danser… et bien désormais, nous pouvons voir Spot parler grâce à ChatGPT ! Dans une vidéo étonnante publiée par la société sur sa chaîne YouTube, nous pouvons constater le chien robot coiffé de différents chapeaux et affublé de postiches comme une fausse moustache ou des deux yeux globuleux, discuter avec des membres du personnel de Boston Dynamics et leur faire visiter les installations de l’entreprise.
Le chien robot Spot de Boston Dynamics « s’humanise » grâce aux modèles IA…
Dans la vidéo YouTube ci-dessus, le chien robot Spot commence par saluer un employé de Boston Dynamics et lui demande son nom. Le robot invite ensuite son interlocuteur humain à « commencer la visite » en démarrant par les stations de recharge, le premier point d’intérêt « où les robots Spot se reposent et se rechargent ». Comme le montre cette démo, Spot est capable de prendre différentes personnalités (un majordome anglais, un voyageur temporel shakespearien, une adolescente robot, etc.) et de répondre à des questions à l’oral tout en ouvrant sa « gueule robotisée », un peu comme la bouche d’une marionnette, pour vraiment donner l’impression qu’il parle.
Pour faire parler son robot à quatre pattes, Boston Dynamics a utilisé l’API ChatGPT d’OpenAI, ainsi que d’autres grands modèles de langage (LLM) pour entraîner minutieusement ses réponses. La société a ensuite équipé Spot d’un haut-parleur et lui a ajouté des capacités de synthèse vocale.
L’ingénieur logiciel principal, Matt Klingensmith, explique que l’équipe de développement a donné au chien robot un « script très bref » pour chaque pièce des installations de Boston Dynamics. Le robot a ensuite combiné ce script avec les images captées par ses caméras intégrées, ce qui lui a permis d’obtenir plus d’informations sur ce qu’il voyait avant de générer une réponse. Selon la société, cette version de Spot utilise un modèle IA de Visual Question Answering (VQA) qui lui permet essentiellement d’analyser des images et de répondre à des questions à leur sujet.
Boston Dynamics a tout de même eu quelques surprises grâce à Spot comme un guide touristique au sein de ses installations. Par exemple, lorsque l’équipe de développement a demandé au robot qui étaient ses « parents », il s’est dirigé presque intuitivement vers l’endroit où les anciens modèles de Spot sont exposés. La société indique également qu’elle a rencontré quelques cas où les modèles IA qui l’alimentent ont inventé des choses. Spot a notamment suggéré que Stretch, un autre robot de Boston Dynamics conçu pour déplacer des cartons dans des entrepôts, était fait pour le yoga.
En bref, il reste un peu de boulot pour dresser Spot, mais cette démo reste assez impressionnante et nous montre l’étendue des possibilités ouvertes par la rencontre entre les modèles IA et la robotique.