II. Historique et contexte
Les concepts comme l’intelligence artificielle (IA), l’apprentissage automatique, les algorithmes et les systèmes d’IA recèlent une grande diversité de significations selon qu’ils sont employés dans un contexte universitaire, politique ou public. On regrettera qu’ils soient souvent utilisés de façon interchangeable. Dans un souci de clarté, quelques définitions et distinctions sont proposées ci-après.
Le concept d’intelligence artificielle fait référence à une intelligence telle qu’elle est manifestée par une machine, l’intelligence étant comprise dans l’optique de son expression chez les humains et les animaux. En tant que discipline universitaire, l’intelligence artificielle étudie les « agents intelligents » ou l’« intelligence informatique », entendus comme des systèmes qui perçoivent leur environnement et entreprennent des actions qui maximisent leurs chances d’atteindre leurs objectifs. L’apprentissage automatique peut être envisagé comme un type spécialisé d’IA dans lequel l’agent, ou le programme informatique, améliore grâce à l’expérience ses performances dans la réalisation d’une tâche donnée. Les systèmes d’apprentissage automatique font appel à « des connaissances préalables ainsi que des données d’entraînement pour guider l’apprentissage ».
Pour le dire simplement, on peut concevoir l’apprentissage automatique comme un type de logiciel qui apprend à partir d’un ensemble de données d’entraînement, dans lequel des étiquettes sont créées et appliquées par des étiqueteurs humains conformément à des connaissances préalables. Un exemple classique est fourni par les programmes de reconnaissance d’images à qui l’on apprend à distinguer des classes d’objets. Dans ce cas, l’ensemble de données d’entraînement consiste en une série d’images préétiquetées à partir de laquelle le système peut déduire des règles de classification à appliquer à de nouvelles images ou à de nouveaux ensembles de données.
En savoir plus
Les algorithmes peuvent être considérés comme les composants essentiels des systèmes d’apprentissage automatique et d’intelligence artificielle qui guident les processus d’apprentissage et de transformation des données d’entrée en données de sortie. En termes mathématiques, on peut concevoir un algorithme comme une construction mathématique dotée d’« une structure de contrôle finie, abstraite, efficace, composée, qui est impérativement donnée et réalise un objectif donné en vertu de règles données ». Dans un souci de clarté, nous proposerons une définition plus simple : un algorithme est une succession d’opérations bien définies qui produit en sortie un résultat à partir d’un ensemble d’éléments fournis en entrée.
Un algorithme d’apprentissage automatique peut être entendu comme un type d’algorithme dans lequel une partie de la succession d’opérations a été apprise plutôt que prédéfinie. Par exemple, un algorithme d’apprentissage automatique utilisé pour réaliser des tâches de classification élabore des classes qui peuvent être généralisées au-delà des données d’entraînement. L’algorithme crée un modèle en vue de classer de nouvelles données d’entrée. Un modèle d’apprentissage automatique est formé des données internes de l’algorithme qui sont adaptées aux données d’entrée afin d’améliorer les performances.
Les technologies de reconnaissance d’images, par exemple, peuvent décider quels types d’objets apparaissent dans une image. L’algorithme « apprend » en définissant des règles permettant de déterminer comment seront classées les nouveaux éléments fournis en entrée. Le modèle peut être enseigné à l’algorithme par des entrées étiquetées manuellement (apprentissage supervisé) ; dans d’autres cas, l’algorithme lui-même définit les modèles les mieux adaptés pour interpréter un ensemble de données d’entrées (apprentissage non supervisé). Dans les deux cas, l’algorithme définit des règles de prise de décision pour traiter les nouveaux éléments fournis en entrée. Un utilisateur humain n’est ordinairement pas en mesure de comprendre de manière critique la logique qui préside aux règles de prise de décision produites par l’algorithme.
Les définitions grand public et politique de ces termes ne se conforme pas à ces définitions formelles, ce qui peut être source de confusion. L’Organisation mondiale de la Santé (OMS), par exemple, définit l’intelligence artificielle comme « l’exécution par des programmes informatiques de tâches généralement associées à des êtres intelligents ». Les définitions de ce type se révèlent problématiques car trop générales, dans la mesure où elles reposent sur la définition de l’« intelligence » et de l’étendue des comportements des « êtres intelligents », et ne peuvent donc pas être utilisées en tant que telles pour classer un système particulier soit comme IA soit comme non-IA uniquement. Cela dit, le caractère ouvert de la définition peut également se révéler utile sur le plan politique, en permettant la prise en compte de systèmes supplémentaires allant au-delà des plus récentes réalisations lors de la rédaction de la première version.
Quelles que soient leurs limites, les définitions politiques de l’IA sont sans doute plus importantes que les définitions techniques si l’on se soucie de l’harmonisation des cadres réglementaires et politiques. La législation sur l’intelligence artificielle (« Artificial Intelligence Act »), un cadre réglementaire horizontal fondé sur les risques proposés par la Commission européenne, donne une définition particulièrement large de l’IA qui promet d’infléchir la politique internationale à l’avenir :
« On entend par “système d’intelligence artificielle” (système d’IA) un logiciel qui est développé au moyen d’une ou plusieurs des techniques et approches énumérées à l’annexe I et qui peut, pour un ensemble donné d’objectifs définis par l’homme, générer des résultats tels que des contenus, des prédictions, des recommandations ou des décisions influençant les environnements avec lesquels il interagit. »
L’annexe à la proposition de législation sur l’intelligence artificielle comporte une liste non exhaustive de techniques et de moyens pouvant être considérés comme relevant de l’IA, qui englobe l’apprentissage automatique, les voies d’approches fondées sur la logique et les connaissances, ainsi que diverses méthodes statistiques :
- « (a) Approches d’apprentissage automatique, y compris d’apprentissage supervisé, non supervisé et par renforcement, utilisant une grande variété de méthodes, y compris l’apprentissage profond ;
- (b) Approches fondées sur la logique et les connaissances, y compris la représentation des connaissances, la programmation inductive (logique), les bases de connaissances, les moteurs d’inférence et de déduction, le raisonnement (symbolique) et les systèmes experts ;
- (c) Approches statistiques, estimation bayésienne, méthodes de recherche et d’optimisation. »
Comme le montre cette définition, un « système d’IA » tel que l’entend la proposition de législation sur l’intelligence artificielle ne s’aligne pas strictement sur les définitions techniques proposées ci-dessus. Par exemple, dans cette définition, l’apprentissage automatique est traité moins comme une composante de l’IA que comme un type spécialisé d’IA. Pour éviter toute ambiguïté et aux fins du présent rapport, nous proposons de définir spécifiquement un « système d’intelligence artificielle » de la manière suivante :
Les « systèmes d’intelligence artificielle » désignent des logiciels autonomes ou intégrés au matériel de traitement de l’information, qui agissent comme un agent intelligent ou font preuve d’intelligence informatique. Un « système d’IA » peut consister en un ou plusieurs algorithmes ou modèles, mais désigne habituellement des systèmes complexes dans lesquels plusieurs algorithmes ou modèles fonctionnent ensemble pour effectuer une tâche complexe.
Le discours public est à l’heure actuelle dominé par des préoccupations relatives à une classe particulière de systèmes d’IA, les systèmes qui prennent des décisions et formulent des recommandations sur des sujets importants ayant trait à la vie quotidienne. Ces systèmes complètent, améliorent ou remplacent l’analyse et la prise de décision humaines et sont fréquemment utilisés en raison de la portée ou de l’ampleur des données et des règles concernées. Le nombre de fonctionnalités prises en compte dans les tâches de classification peut atteindre plusieurs millions. Ces tâches reproduisent des traitements de données précédemment effectués par des travailleurs humains, mais à une échelle bien plus considérable et en faisant appel à une logique décisionnelle qualitativement distincte. Ces systèmes prennent des décisions généralement fiables (mais pas nécessairement correctes) sur la base de règles complexes qui mettent au défi ou en échec les capacités humaines d’action et de compréhension[6]. Autrement dit, le présent rapport traite des systèmes d’IA dont les actions sont difficiles à prévoir pour l’homme ou dont la logique décisionnelle est difficile à expliquer après coup.