IA et lutte contre le coronavirus Covid-19
Aperçu réalisé par le secrétariat du Comité ad hoc sur l’intelligence artificielle (CAHAI)
Ce document est également disponible en:
Ce document vise à fournir un aperçu non exhaustif des articles des médias et d'autres sources publiques disponibles. Il ne reflète pas les vues du CAHAI et du Conseil de l’Europe.
L’intelligence artificielle (IA) est utilisée pour venir porter appui à la lutte contre la pandémie virale touchant le monde entier depuis le début de l’année 2020. La presse et la communauté scientifique se font écho des grands espoirs reposant sur la science des données et l’IA pour affronter le coronavirus (D. Yakobovitch, How to fight the Coronavirus with AI and Data Science, Medium, 15 février 2020) et « remplir les vides » encore laissés par la science (G. Ratnam, Can AI Fill in the Blanks About Coronavirus? Experts Think So, Government Technology, 17 mars 2020).
La Chine, premier épicentre de cette maladie et réputée pour son avancée technologique en la matière, a tenté d’en tirer un avantage déterminant. Ses usages semblent avoir concerné tant l’appui à des mesures restrictives de circulation des populations que les prévisions d’évolution des foyers de la maladie ou la recherche pour l’élaboration d’un vaccin ou d’un traitement. Concernant ce dernier aspect, l’IA a été employée pour accélérer le séquençage du génome, effectuer des diagnostics plus rapides, réaliser des analyses par scanner ou plus ponctuellement recourir à des robots de maintenance et de livraison (A. Chun, In a time of coronavirus, China’s investment in AI is paying off in a big way, South China Morning post, 18 mars 2020).
Ses apports, également indéniables pour organiser un meilleur accès aux publications scientifiques ou appuyer la recherche, ne lui ont toutefois pas permis de supprimer les phases de tests cliniques ni de se substituer entièrement à l’expertise humaine. Les difficultés structurelles rencontrées par les infrastructures sanitaires dans cette situation de crise ne relèvent pas de solutions technologiques mais de l’organisation des services de santé, qui devraient pouvoir prévenir de telles situations (article 11 de la Charte sociale européenne). Les mesures d’urgence édictées employant des solutions technologiques, dont l’IA, devraient être évaluées en sortie de crise. Celles attentatoires aux libertés des individus, ne sauraient pas être banalisées au prétexte d’une meilleure protection des populations. Les dispositions de la Convention 108(+) doivent notamment continuer à s’appliquer.
La contribution de l’intelligence artificielle pour la recherche d’un traitement
La première application de l’IA attendue face à une crise sanitaire est certainement l’assistance aux chercheurs pour concevoir un vaccin, à même de protéger les soignants et d’endiguer la pandémie. La biomédecine et la recherche s’appuient sur de très nombreuses techniques parmi lesquelles les diverses applications de l’informatique et de la statistique ont déjà offert depuis bien longtemps des apports. L’emploi de l’IA s’inscrit donc dans cette continuité.
Les prédictions de la structure du virus générées par l'IA a déjà fait gagner des mois d'expérimentation aux scientifiques. L’IA semble avoir apporté un appui notable en ce sens, même si elle est limitée du fait de règles dites « continues » et d’une combinatoire infinie pour l’étude du repliement des protéines. La startup américaine Moderna s’est illustrée par sa maîtrise d’une biotechnologie fondée sur l’acide ribonucléique messager (messenger Ribonucleic acid – mRNA) pour laquelle l’étude du repliement des protéines est essentiel. Elle est parvenue à réduire significativement le temps pour développer un prototype de vaccin testable sur l’homme grâce à l’appui de la bioinformatique, dont l’IA fait partie intégrante.
De même, le géant technologique chinois Baidu a publié en février 2020, en partenariat avec l'Université d'État de l'Oregon et l'Université de Rochester, son algorithme de prédiction Linearfold afin d’étudier ce même repliement des protéines. Cet algorithme est beaucoup plus rapide que les algorithmes traditionnels afin de prédire la structure de l'acide ribonucléique (ARN) secondaire d'un virus et de fournir aux scientifiques des informations supplémentaires sur la manière dont les virus se propagent. La prédiction de la structure secondaire de la séquence d'ARN du Covid-19 aurait ainsi été calculée par Linearfold en 27 secondes, au lieu de 55 minutes (Baidu, How Baidu is bringing AI to the fight against coronavirus, MIT Technology Review, 11 mars 2020). DeepMind, filiale de la société mère de Google, Alphabet, a également partagé ses prédictions sur la structure des protéines du coronavirus, avec son système d'IA AlphaFold (J. Jumper, K. Tunyasuvunakool, P. Kohli, D. Hassabis et al., Computational predictions of protein structures associated with COVID-19, DeepMind, 5 mars 2020). IBM, Amazon, Google et Microsoft ont également fourni la puissance de calculs de leurs serveurs aux autorités américaines pour pouvoir traiter les très grands jeux de données en matière d’épidémiologie, de bioinformatique et de modélisation moléculaire (F. Lardinois, IBM, Amazon, Google and Microsoft partner with White House to provide compute resources for COVID-19 research, Techcrunch, 22 mars 2020).
L’intelligence artificielle, moteur de partage de la connaissance
Aux États-Unis, le Bureau des politiques scientifiques et technologiques de la Maison Blanche (Office of Science and Technology Policy) a rencontré pour sa part le 11 mars 2020 les entreprises technologiques et les grands groupes de recherche afin de déterminer comment les outils d'IA pourraient être utilisés pour, notamment, passer au crible les milliers d'articles de recherche publiés dans le monde sur la pandémie (A. Boyle, White House seeks the aid of tech titans to combat coronavirus and misinformation, GeekWire, 11 mars 2020).
En effet, dès les semaines qui ont suivi l'apparition du nouveau coronavirus à Wuhan en Chine en décembre 2019, près de 2 000 articles de recherche ont été publiés sur les effets de ce nouveau virus, sur les traitements possibles, ainsi que sur la dynamique de la pandémie. Cet afflux de littérature scientifique témoigne naturellement de l’empressement des chercheurs à traiter cette crise sanitaire majeure, mais il représente également un réel défi pour quiconque espère en exploiter la substance.
Microsoft Research, la National Library of Medicine et l'Allen Institute for AI (AI2) ont donc présenté leurs travaux le 16 mars 2020 qui ont consisté à rassembler et à préparer plus de 29 000 documents relatifs au nouveau virus et à la famille plus large des coronavirus, dont 13 000 ont été traités afin que les ordinateurs puissent lire les données sous-jacentes, ainsi que des informations sur les auteurs et leurs affiliations. Kaggle, filiale de Google et plateforme qui organise habituellement des concours de science des données (data science), a créé pour sa part des défis autour de 10 questions clés liées au coronavirus. Ces questions vont des facteurs de risque et des traitements non médicamenteux aux propriétés génétiques du virus en passant par les efforts de développement de vaccins. Le projet implique également l'initiative Chan Zuckerberg (du nom de Mark Zuckerberg, fondateur de Facebook, et de sa femme Priscilla Chan) et le Centre pour la sécurité et les technologies émergentes de l'université de Georgetown (W. Knight, Researchers Will Deploy AI to Better Understand Coronavirus, Wired, 17 mars 2020).
L’intelligence artificielle, observateur et prédicteur de l’évolution de la pandémie
La société canadienne BlueDot est présentée comme ayant détecté le virus de manière précoce grâce à une IA et à sa capacité d’examiner de manière continue de plus de 100 jeux de données, tels que les actualités, les ventes de billets d'avion, les données démographiques, les données climatiques et les populations animales. BlueDot a détecté ce qui était alors considéré comme une épidémie de pneumonie à Wuhan, en Chine, le 31 décembre 2019 et a identifié les villes qui risquaient le plus d'être confrontées à cette épidémie (C. Stieg, How this Canadian start-up spotted coronavirus before everyone else knew about it, CNBC, 3 mars 2020).
Une équipe de chercheurs travaillant avec le Boston Children's Hospital a également mis au point une IA pour suivre la propagation du coronavirus. Appelé HealthMap, le système intègre des données provenant de recherches sur Google, de médias sociaux et de blogs, ainsi que des forums de discussion : des sources d'informations que les épidémiologistes n'utilisent généralement pas, mais qui sont utiles pour identifier les premiers signes d'une épidémie et évaluer la réaction du public (A. Johnson, How Artificial Intelligence is Aiding the fight Against Coronavirus, Datainnovation, 13 mars 2020).
Le Centre international de recherche sur l'intelligence artificielle (IRCAI) en Slovénie, placé sous l'égide de l'UNESCO, a lancé de son côté une veille médiatique « intelligente » sur le coronavirus appelée Corona Virus Media Watch qui fournit des mises à jour sur l'actualité mondiale et nationale en se basant sur une sélection de médias ayant des informations ouvertes en ligne. L'outil, conçu également avec l’appui de l’OCDE et la technologie d’extraction d’information Event Registry, est présenté comme une source d’information utile aux décideurs politiques, aux médias et au public pour observer les tendances émergentes liées au Covid-19 dans leur pays et dans le monde.
L’intelligence artificielle, en assistance aux personnels soignants
Deux entreprises chinoises ont développé pour leur part un logiciel de diagnostic du coronavirus basé sur l'IA. La startup Infervision, basée à Pékin, a ainsi formé son logiciel à la détection des problèmes pulmonaires par tomodensitométrie (scanner). Utilisé à l'origine pour diagnostiquer le cancer du poumon, le logiciel peut également détecter les pneumonies associées à des maladies respiratoires comme le coronavirus. Au moins 34 hôpitaux chinois auraient utilisé cette technologie pour les aider à examiner 32 000 cas suspects (T. Simonite, Chinese Hospitals Deploy AI to Help Diagnose Covid-19, Wired, 26 février 2020).
L'Alibaba DAMO Academy, branche de recherche de la société chinoise Alibaba, a également formé un système d'IA pour reconnaître les coronavirus avec une précision alléguée de 96 %. Selon cette société, le système pourrait ainsi traiter les 300 à 400 scanners nécessaires pour diagnostiquer un coronavirus en 20 à 30 secondes, alors que la même opération prendrait habituellement entre 10 à 15 minutes à un médecin expérimenté. Ce système aurait aidé au moins 26 hôpitaux chinois à examiner plus de 30 000 cas.
En Corée du Sud, l’IA aurait aidé à réduire à quelques semaines la conception de kits de dépistages basés sur la constitution génétique du virus, alors qu’il aurait fallu habituellement de deux à trois mois. La société de biotechnologie Seegene a ainsi utilisé son système de développement de tests automatisés pour mettre au point ce kit de dépistage et le distribuer largement. La réalisation de tests à grande échelle est en effet cruciale pour sortir des mesures de confinement et cette politique de tests paraît avoir contribué à la relative maîtrise de la pandémie dans ce pays, qui a équipé avec ce dispositif 118 établissements médicaux et testé plus de 230 000 personnes (I.Watson, S.Jeong, J.Hollingsworth, T.Booth, How this South Korean company created coronavirus test kits in three weeks, CNN World, 13 mars 2020).
L’intelligence artificielle, outil de contrôle de la population
L’exemple donné par Singapour pour maîtriser les risques épidémiques, avec l’appui des technologies est certainement unique et difficilement exportable du fait de l’acceptation sociale de mesures contraignantes de sécurité : délivrance d’un ordre de confinement pour les populations à risque, vérifications du respect des mesures par téléphone portable et géolocalisation, contrôles à domicile aléatoires (K. Vaswani, Coronavirus: The detectives racing to contain the virus in Singapore, BBC News, 19 mars 2020). L’IA a été assez largement utilisée en appui de ce type de politiques de surveillance de masse comme en Chine, où des dispositifs ont pu être utilisés pour mesurer la température et reconnaître les individus ou encore pour équiper les forces de l’ordre avec des casques « intelligents » en mesure de signaler les individus avec une température corporelle élevée. Les dispositifs de reconnaissance faciale ont toutefois connu des difficultés avec le port de masques chirurgicaux, ce qui a conduit une entreprise à tenter de contourner cette difficulté puisque nombre de services en Chine s’appuient désormais sur cette technologie, dont les services étatiques pour des mesures de surveillance. Hanvon allègue ainsi avoir créé un dispositif permettant d’augmenter le taux de reconnaissance des porteurs de masques chirurgicaux à 95% (M. Pollard, Even mask-wearers can be ID'd, China facial recognition firm says, Reuters, 9 mars 2020). En Israël, un plan visant à utiliser le suivi téléphonique individuel pour avertir les utilisateurs de ne pas côtoyer des personnes potentiellement porteuses du virus a été élaboré (A. Laurent, COVID-19 : des États utilisent la géolocalisation pour savoir qui respecte le confinement, Usebk & Rica, 20 mars 2020). En Corée du Sud, une alerte transférée aux autorités sanitaires se déclenche quand les personnes ne respectent pas la période d’isolement, en se rendant par exemple dans un lieu fréquenté comme les transports en commun ou un centre commercial (Ibid.). À Taïwan, un téléphone portable est remis aux personnes contaminées et enregistre leur position GPS pour que la police puisse suivre leurs déplacements et s’assurer qu’elles ne s’éloignent pas de leur lieu de confinement (Ibid.). En Italie, une entreprise a également développé une application sur téléphone intelligent (smartphone) permettant de reconstituer l’itinéraire d’un individu atteint du virus et d’avertir les personnes ayant eu un contact avec elle. D’après le concepteur, la vie privée serait garantie, car l’application ne révèlerait pas les numéros de téléphone ou des données personnelles (E. Tebano, Coronavirus, pronta la app italiana per tracciare i contagi: ‘Così possiamo fermare l’epidemia’, Corriere della Sera, 18 mars 2020). En Lombardie, les opérateurs téléphoniques ont mis à disposition les données concernant le passage d’un téléphone portable d’une borne téléphonique à une autre (M. Pennisi, Coronavirus, come funzionano il controllo delle celle e il tracciamento dei contagi. Il Garante: «Non bisogna improvvisare», Corriere della Sera, 20 mars 2020).
Aux États-Unis, l’on retrouve cette tension entre garantie des droits individuels et protection des intérêts collectifs en cette période de crise sanitaire. Ainsi, les GAFAM disposent dans le d’informations extrêmement précieuses en période de crise : une immense quantité de données sur la population américaine. Larry Brilliant, épidémiologiste et directeur exécutif du site Google.org, affirme ainsi pouvoir « changer le visage de la santé publique » et estime que « peu de choses dans la vie sont plus importantes que la question de savoir si les grandes technologies sont trop puissantes, mais une pandémie en fait sans aucun doute partie » (N. Scola, Big Tech faces a ‘Big Brother’ trap on coronavirus, POLITICO, 18 mars 2020). Le gouvernement américain a donc demandé à ces entreprises d’avoir accès à des données agrégées et anonymes, notamment sur les téléphones portables, afin de lutter contre la propagation du virus (T. Romm, E. Dwoskin, C. Timberg, U.S. government, tech industry discussing ways to use smartphone location data to combat coronavirus, The Washington Post, 18 mars 2020). Ces entreprises se sont toutefois montrées prudentes au vu du risque juridique et du potentiel préjudice d’image (S. Overly, White House seeks Silicon Valley help battling coronavirus, POLITICO, 11 mars 2020). Une réglementation sur les données aurait vraisemblablement aidé à encadrer le dialogue entre le secteur public et privé, et à déterminer quels types d’urgences doivent faire primer l’intérêt collectif sur les droits individuels (ainsi que les conditions et garanties d’un tel dispositif), mais le Congrès n'a toujours pas avancé depuis les deux dernières années sur une telle loi.
Enfin, des tentatives de désinformation ont proliféré sur les réseaux sociaux et internet. Qu’il s’agisse du virus lui-même, de sa manière de se propager ou des moyens pour lutter contre ses effets, nombre de rumeurs se sont propagées (“Fake news” et désinformation autour du coronavirus SARS-CoV2, INSERM, 19 février 2020). L’IA est une technologie déjà employée avec une certaine efficacité par les plateformes pour lutter contre des contenus inappropriés. L’UNICEF a adopté le 9 mars 2020 une déclaration sur la désinformation concernant le coronavirus dans laquelle elle entend prendre « activement des mesures pour fournir des informations précises sur le virus en travaillant avec l'Organisation mondiale de la santé, les autorités gouvernementales et des partenaires en ligne comme Facebook, Instagram, LinkedIn et TikTok, pour s'assurer que des informations et des conseils précis soient disponibles, ainsi qu'en prenant des mesures pour informer le public lorsque des informations inexactes apparaissent ». L’édiction au sein des Etats membres du Conseil de l’Europe des mesures restrictives pour éviter d’alimenter des inquiétudes dans la population est également envisagée. Le comité d'experts du Conseil de l'Europe sur l’environnement des médias et la réforme du Conseil de l’Europe (MSI-REF) a toutefois rappelé dans une déclaration du 21 mars 2020 que « la situation de crise ne doit pas servir de prétexte pour restreindre l'accès du public à l'information. Les États ne devraient pas non plus introduire de restrictions à la liberté des médias au-delà des limites autorisées par l'article 10 de la Convention européenne des droits de l'homme ». Le comité rappelle aussi que les « États membres, avec tous les acteurs des médias, devraient s'efforcer de garantir un environnement favorable à un journalisme de qualité ».
L’intelligence artificielle : un usage à évaluer en sortie de crise
Les technologies numériques, dont l’informatique et l’IA, s’avèrent donc être des instruments pertinents pour participer à la construction d’une réponse coordonnée contre cette pandémie. Les multiples usages illustrent également les limites des promesses de ces mêmes technologies, dont nous ne pouvons attendre qu’elles compensent des difficultés structurelles comme celles que connaissent de nombreux établissements de soins dans le monde. La recherche d’efficacité et de réduction des coûts dans les hôpitaux, souvent appuyées par des technologies informatiques, ne devraient pas avoir pour effet de réduire la qualité des prestations ou de compromettre un accès universel à des soins, même en cas de circonstances exceptionnelles.
Rappelons en ce sens que l’article 11 de la Charte sociale européenne (ratifiée par 34 des 47 États membres du Conseil de l’Europe) édicte un droit à la protection de la santé qui engage les signataires « à prendre, soit directement, soit en coopération avec les organisations publiques et privées, des mesures appropriées tendant notamment : 1°) à éliminer, dans la mesure du possible, les causes d’une santé déficiente ; 2°) à prévoir des services de consultation et d’éducation pour ce qui concerne l’amélioration de la santé et le développement du sens de la responsabilité individuelle en matière de santé ; 3°) à prévenir, dans la mesure du possible, les maladies épidémiques, endémiques et autres, ainsi que les accidents. »
Enfin, les mesures d’urgence prises devraient pouvoir être évaluées en sortie de crise afin d’identifier les apports et les écueils rencontrés par l’emploi d’outils numérique et l’IA. Les mesures provisoires de contrôle et de suivi en masse de la population par les technologies ne devraient pas, notamment, être banalisées et devenir permanentes (Y. N. Harari, Yuval Noah Harari: the world after coronavirus, The Financial Times, 20 mars 2020).
Les standards en matière de protection des données, comme la Convention 108(+) du Conseil de l’Europe, doivent pouvoir continuer à s’appliquer pleinement en toutes circonstances : qu’il s’agisse de l’utilisation de données biométriques, de la géolocalisation, de la reconnaissance faciale et de l’exploitation de données de santé, le déploiement d’applications en urgence doit s’effectuer en concertation avec les autorités de protection des données et dans le respect de la dignité et de la vie privée des utilisateurs. Il devrait être considéré les possibles biais dans les divers types d’opérations de surveillance basés sur des données, qui sont susceptibles de créer d’importantes discriminations (A.F. Cahn, John Veiszlemlein, COVID-19 tracking data and surveillance risks are more dangerous than their rewards, NBC News, 19 mars 2020).