Louis Hugues wiki - Résumé de ThèseDernière modification : 2008/11/18 19:26 |
||
---|---|---|
Accueil / Changements récents | Éditer | |
Apprentissage de comportements pour un robot autonomeContexte et problématique généraleContributionApprentissage de comportements pour un robot autonomeThèse de Doctorat de l'Université Paris 6.Soutenue par Louis Hugues le 19 décembre 2002 Mention : très honorable Jury : Jean Sallantin (rapporteur) Philippe Gaussier (rapporteur) Patrick Gallinari,(président) Rachid Alami (examinateur) Jean Daniel Zucker (examinateur) Alexis Drogoul (directeur) Télécharger zipped pdf (french) Docking behavior : an exemple of behavior learned by demonstrations without any model of the environment. Video (.mov 3.1M) Contexte et problématique généraleCe travail de thèse a été effectué au Laboratoire d'Informatique de l'Université Pierre et Marie Curie (LIP6) dans le cadre du projet MICRobES dirigé par A. Drogoul et mené par l'équipe Systèmes Multi-Agent/Intelligence Artificielle Distribuée (MIRIAD), consistant en l'étude des pré-requis pour l'intégration de groupes de robots autonomes dans les environnements humains. Dans ce cadre, mes travaux ont porté sur la transmission de compétences concrètes à des robots autonomes . Cette problématique est intéressante, à la fois du point de vue de l'étude de la cognition en général mais aussi pour ses éventuelles retombées pratiques. En effet, dans un futur proche on peut s'attendre à ce que des robots mobiles remplissent des tâches dans des lieux aussi divers que les bureaux d'entreprises, les hôpitaux, les ateliers d'usines. L'intégration de robots autonomes mobiles dans de tels environnements réels, foncièrement différents des environnements simulés, requiert de doter ceux ci de comportements prenant en compte la nature incomplète, imprécises et incertaines de leurs perceptions ainsi que le caractère en partie imprédictible de leurs actions. Les robots appelés à évoluer dans ces environnements dynamiques très difficilement modélisables devront pourtant se comporter de manières utiles aux humains et être continuellement réadaptés à leurs besoins. La question se pose alors de savoir comment ces robots peuvent acquérir leurs comportements ? Certains comportements peuvent être programmés explicitement mais il faut pour cela disposer d'une description explicite des tâches à effectuer ainsi que d'un modèle de l'environnement ou il est possible de distinguer des invariants précis (positions des objets, distance aux obstacles…). D'autres comportements peuvent êtres appris en utilisant des méthodes téléologiques telles que l'apprentissage par renforcement ou les algorithmes génétiques. Mais celles-ci imposent elles aussi de définir explicitement les comportements, par l'intermédiaire de fonctions d 'évaluation ou de récompenses. De plus elles nécessitent une stratégie d'essais erreurs impossible à mettre en œuvre dans la plupart des environnements. ContributionLa transmission de compétences à un robot autonome pose le problème d'associer une valeurs aux actions possibles. Ma principale hypothèse a consisté à penser que cet apprentissage devait se produire principalement lors d'interactions entre le robot et son concepteur (devenu tuteur) dans l'environnement de destination. D'abord en montrant des exemples des comportements souhaités, puis en interagissant en temps réel avec le robot il est, en effet, possible de transmettre un comportement sans le définir explicitement et sans avoir besoin d'un modèle du monde. Un tel processus d'apprentissage empirique suppose :
Le modèle proposé a été validé sur un prototype développé sur un robot réel. Il a été montré qu'il est possible d'enseigner rapidement au robot des comportements situés très difficiles, voire impossibles, à programmer et de plus inaccessibles à des méthodes d'apprentissages numériques 'classiques'. L'intérêt des deux phases d'amorçage d'adaptations y a clairement été montré. A l'occasion de ce travail les principales techniques mises en œuvres ont porté sur la structure distribuée du comportement, la vision, l'apprentissage numérique de type probabiliste, l'architecture temps réel et l'interface homme machine. (C++, Linux, Java). Ces travaux ont donnés lieu à des publications dans des conférences internationales de très bon niveau (ECAI,IROS). |
||
Wiki utilisant WiKiss 0.3
2024/12/11 14:27 -- 18.97.14.85 |
Éditer |