WisdomTree
ai-3.jpg

Les grands modèles de langage transformeront-ils la robotique ?

Publié le 13 novembre 2024

Christopher Gannatti, CFA
Christopher Gannatti, CFA

Global Head of Research

Hans Moravec, membre adjoint du corps professoral de l’Institut de robotique de l’Université Carnegie Mellon, a écrit en 1988 : « Il est relativement facile de faire en sorte que les ordinateurs réalisent des performances du niveau d’un adulte lors de tests d’intelligence ou au jeu de dames. En revanche, il est difficile voire impossible de leur conférer les compétences d’un enfant d’un an en matière de perception et de mobilité ».

Pour illustrer ce point, nous pouvons également prendre l’exemple de la conduite d’un véhicule. Aux États-Unis, il est courant pour un lycéen d’environ 16 ans d’obtenir un « permis d’apprentissage » durant l’été, généralement entre la deuxième année et la troisième année de lycée. Au cours de l’été, aux côtés d’un conducteur agréé, le lycéen accumule un certain nombre d’heures et de kilomètres d’expérience de conduite. Dans la plupart des cas, cela suffit pour réussir l’ « épreuve de conduite » qui est administrée au niveau des États.

D’un autre côté, il existe des systèmes de conduite autonome qui ont été formés, dans de nombreux cas en simulation, ce qui équivaut à plusieurs milliards de kilomètres parcourus. Pourtant forts d’une expérience virtuelle de plusieurs milliards de kilomètres, ces systèmes ne sont pas considérés comme suffisamment fiables pour pouvoir être déployés à travers le monde.

De nombreux cas comme celui-ci existent, qui illustrent de plus en plus clairement que la manière dont les humains apprennent est totalement différente de celle dont les systèmes informatiques apprennent.

Le cas de Covariant

Covariant Robotics dispose d’un excellent site Web, sur lequel il est possible de visionner différentes vidéos de systèmes robotiques effectuant diverses tâches. Nous aimons le souligner auprès des investisseurs, car cela illustre de manière simple un aspect que nous considérons extrêmement important :

  • L’« ancienne approche » d’exécution d’un système robotique consiste à programmer ce système pour qu’il accomplisse précisément une tâche. L’avantage de cette approche est que le système est entièrement déterministe, c’est-à-dire qu’un robot n’effectuera jamais quelque chose d’inattendu. L’inconvénient en revanche est que si la tâche ne peut pas être explicitement programmée, le robot ne sera pas en capacité de l’accomplir.
  • La « nouvelle approche » d’exécution d’un système robotique consiste à guider un grand modèle de langage (LLM) vers une tâche, et à indiquer au système un objectif global. Il peut s’agir par exemple de trier différents éléments dans un conteneur. Au lieu de programmer tous les scénarios possibles et de chercher à prendre en compte toutes les combinaisons potentielles d’éléments dans un conteneur, le système pourrait optimiser le tri des éléments du conteneur sur la base d’un ensemble de principes fondamentaux. L’avantage d’une telle approche réside bien entendu dans la flexibilité acquise, mais le risque est qu’il peut être difficile de comprendre ce que le robot va faire, créant ainsi un ensemble de circonstances potentiellement dangereuses si, par exemple, des personnes sont placées à proximité du robot.

De notre point de vue, les vidéos du site Web de Covariant illustrent formidablement cette question. Le système associe les commandes du robot à une interface en langage naturel, de sorte que lorsque le dispositif effectue différentes tentatives pour accomplir une tâche, l’écran affiche un texte expliquant ce que le robot est sur le point d’essayer.

La vidéo qui fait apparaître le système de préhension, principalement basé sur des tentatives d’aspiration pour ramasser et trier des paires de chaussettes, est particulièrement fascinante. Si l’on imagine comment les chaussettes sont le plus souvent emballées, on trouve généralement une surface lisse et adhésive en matériau de type papier au centre, avec le tissu des chaussettes qui dépasse à chaque extrémité.

Amazon recrute les fondateurs de Covariant1

Amazon constitue l’un des plus formidables cas d’étude de la gestion logistique que nous ayons jamais observés dans le domaine du commerce mondial. L’entreprise est capable de livrer de nombreux articles différents dans un délai d’une journée, voire moins, vers quasiment n’importe quelle destination à travers le monde. C’est une véritable prouesse opérationnelle.

Si l’on raisonne intuitivement, les robots pourraient contribuer à cet effort, puisqu’ils peuvent fonctionner sans relâche, 24 heures sur 24, 7 jours sur 7, 365 jours par an. Or, pour cela, il est notamment nécessaire qu’ils puissent attraper et trier correctement quasiment tous les types d’articles. Rappelez-vous ce que souligne Hans Moravec : développer et programmer un système capable de gérer correctement n’importe quel objet est beaucoup plus difficile qu’il n’y paraît.

Lorsque nous avons découvert dans une publication de WIRED qu’Amazon recrutait les fondateurs de Covariant et entendait utiliser sa technologie sous licence, notre enthousiasme a été total. Il a toujours été fascinant de visiter le site Web de Covariant. Pour autant, si dans les prochaines années nous pouvons commencer à raconter comment la technologie robotique, combinée aux LLM, alimente l’activité logistique d’Amazon, alors cette histoire deviendra tout simplement explicite en termes de puissance de l’intersection entre la robotique et l’IA. Il est encore relativement tôt, mais nous continuerons de surveiller de très près l’évolution de la robotique.

1 Knight, Will. “This Could Be the Start of Amazon’s Next Robot Revolution.” WIRED. 4 September 2024.

À propos du contributeur

Christopher Gannatti, CFA
Christopher Gannatti, CFA

Global Head of Research

Christopher Gannatti dirige l’équipe de recherche mondiale de WisdomTree, apportant sa riche expérience à l’entreprise. Depuis son arrivée en décembre 2010, Chris a progressé dans l’organisation avant d’en assumer la direction en 2021. Dans le cadre de sa mission mondiale, Chris joue un rôle crucial dans la conception des initiatives de WisdomTree aux États-Unis et en Europe. Son expertise repose sur les actions et les thématiques technologiques, en accordant une attention particulière à la mise en récit et aux analyses stratégiques. Basé aux États-Unis, il travaille en étroite collaboration avec Jeremy Schwartz, Directeur mondial des investissements. Avant de rejoindre WisdomTree, Chris a travaillé chez Lord Abbett en tant que consultant régional, en collaboration avec des conseillers financiers basés dans la région du Midwest. Il est titulaire d’un diplôme en économie de l’université Colgate et d’un MBA de la NYU Stern School of Business, avec des spécialisations en finance quantitative, comptabilité et économie. Il possède également la certification CFA. Chris est un véritable visionnaire, reconnu pour son leadership éclairé et sa capacité à expliquer efficacement des stratégies complexes.

Best Workspaces - GPTW UK 2024
Best Workspaces for Development - GPTW UK 2024
Best Workspaces for Women - GPTW UK 2024
Best Workspaces in Financial Services & Insurance - GPTW UK 2024
Important Risk Information

Juridictions de l’Espace économique européen (« EEE ») : Ce site Web et son contenu ont été fournis et sont maintenus par WisdomTree Ireland Limited, une société autorisée et réglementée par la Banque centrale d’Irlande.

Juridictions en dehors de l’EEE : Ce site Web et son contenu ont été fournis et sont maintenus par WisdomTree UK Limited, une société autorisée et réglementée par l’instance de régulation du secteur financier au Royaume-Uni (United Kingdom Financial Conduct Authority).

Le cours des actions ou la valeur des investissements dans des ETP peuvent fluctuer à la hausse comme à la baisse et les investisseurs ne sont pas assurés de récupérer les montants investis. Les performances passées ne sauraient être un indicateur fiable des résultats futurs. Le présent document ne doit pas être considéré comme une prévision, une analyse financière ou une recommandation, non plus que comme une offre ou une sollicitation pour acheter ou vendre de quelconques instruments ou produits financiers ou pour adopter une quelconque stratégie d'investissement.

Veuillez cliquer ici pour lire notre clause de non-responsabilité dans son intégralité.

© 2026 WisdomTree, Inc. All Rights Reserved