Le but de notre projet est de fournir des pistes concernant l’utilisation de la science des données au service du bien commun. Selon le Centre des Compétences en Sciences des Données (CCSD) de l’Université de Genève, la science des données se définit comme la science de l’apprentissage à partir de données. Il s’agit donc d’extraire des informations concrètes et exploitables à partir de données brutes, en identifiant des tendances et des corrélations parmi des larges ensembles de données. C’est un domaine interdisciplinaire, qui comprend les statistiques, les algorithmes, les mathématiques, mais aussi des aspects sociaux comme l’éthique ou la communication.  

Il faut aussi définir la notion de “bien commun”, qui peut paraître floue et subjective. Le Pape Jean XXIII donne, en 1961, une définition générale de celui-ci : « L’ensemble des conditions sociales permettant à la personne d’atteindre mieux et plus facilement son plein épanouissement ». Il s’agit du bien pour la communauté sociale: ce qui est bon pour une personne ne l’est pas toujours pour l’ensemble de sa communauté. Ce bien doit émaner de la communauté, être commun à tous, et doit permettre à chaque être humain d’atteindre ses objectifs individuels. Pour Hubert Allier, conseiller économique, social et environnemental, il s’agit d’atteindre trois objectifs : garantir un épanouissement personnel, garantir les conditions d’un bien-vivre ensemble et étendre cette garantie aux générations futures. Ces objectifs sont proches de la vision du développement durable de l’ONU et ses 17 objectifs de développement durable. 

L’UNESCO a mis au point une “Déclaration universelle sur la bioéthique et les droits de l’homme”. L’objectif était de déterminer un bien et une éthique à l’échelle planétaire, que ce soit dans les domaines sociaux, économiques et environnementaux. Des nations du monde entier ont participé, de manière démocratique, afin de mettre en relations différentes valeurs et cultures pour élaborer un “bien universel”. Cette déclaration (consultable dans l’onglet “aller plus loin”) met l’accent sur le respect de la dignité de quiconque, l’autonomie et le consentement dans la prise de décision, le respect de la vulnérabilité et de la vie privée, du pluralisme de pensées, et encore d’autres principes qui servent de base dans notre vision du bien commun. Toutes ces visions nous permettent d’identifier un lien entre bien commun et démocratie. 

Le potentiel de la science des données au service du bien commun 

La science des données est en progrès permanent. Elle permet de se pencher sur la gestion de tâches et la résolution de problèmes de plus en plus complexes. Les algorithmes et l’intelligence artificielle, de plus en plus élaborés, permettent d’assister à la prise de certaines décisions, l’automatisation de certaines tâches, la détection d’anomalies et de fraudes, la prédiction et détection de tendances, ou encore une cybersécurité renforcée. Nous allons voir quelques exemples d’applications concrètes de la science des données au service du bien commun, qui touchent une, voire plusieurs, des trois grandes sphères du développement durable (économique, sociale et environnementale). 

L’Open Data et le domaine médical

Tout d’abord, dans le domaine de la santé, les données ouvertes (open data) sont utilisées pour renforcer la surveillance de la santé de la population. Aux Etats-Unis, le Système de surveillance des facteurs de risque comportementaux (SSFRC) est utilisé pour surveiller les urgences en santé publique et y réagir en temps réel. Ce système est constamment renforcé par l’utilisation de données ouvertes. Il a servi, par exemple, à la mise en place de mesures d’intervention contre les effets de l’ouragan Katrina en 2005, ou à surveiller l’utilisation du vaccin contre la grippe H1N1 pendant la pandémie en 2009. Le Canada dispose d’une base de données sur la santé publique qui permet de visualiser l’évolution des maladies chroniques ou infectieuses, ou de la santé mentale de la population, afin de détecter les facteurs de risque et de prendre des mesures en conséquence. Le pays dispose d’un site web public qui permet à chaque citoyen et chaque citoyenne de créer des figures et des tableaux personnalisés pour différentes maladies et de tenir compte des tendances par âge, sexe et année. L’avantage de l’open data est que ces données peuvent être partagées et combinées avec d’autres ensembles de données, ce qui crée de nouvelles possibilités de collaborations scientifiques. Par exemple, on a associé les données de surveillance des maladies sexuellement transmissibles au nombre de messages de santé publique liés à ces maladies sur les  réseaux sociaux. Par la suite, on a évalué l’efficacité des campagnes de sensibilisation dans la lutte contre les éclosions de maladies infectieuses. 

La technologie au service du bien environnemental 

Dans un autre domaine, on peut prendre l’exemple de l’utilisation de données pour l’optimisation énergétique. Pour le chauffage, la consommation énergétique d’un bâtiment varie selon la taille du bâtiment et son isolation. Les besoins énergétiques pour chauffer un bâtiment dépendent aussi de conditions externes, comme la température extérieure, l’humidité ou le soleil. Plusieurs modèles ont été développés pour optimiser cette consommation d’énergie. Par exemple, à partir de données historiques, un arbre de décisions peut prédire la demande énergétique d’un bâtiment, les moments où la demande d’énergie sera importante, ou faible. Ces systèmes analysent une combinaison de conditions ambiantes internes et externes, et déterminent l’influence des conditions externes sur la température interne d’un bâtiment. Cela permet de déterminer quand le bâtiment a besoin de plus ou moins d’énergie afin d’être chauffé à une température confortable pour ses occupantes et occupants. Une autre étude a montré que les besoins énergétiques pour le chauffage vont varier selon les activités des occupantes et occupants du bâtiment. Il s’agit donc de prendre tout cela en compte afin d’optimiser les dépenses en énergie, ce qui constitue un avantage environnemental et économique pour les firmes. 

La récolte participative des données 

La science des données permet également de créer des communautés, de fédérer des personnes autour d’une thématique, par le biais d’une application mobile ou d’un service sur internet. Par exemple, après le tremblement de terre et le tsunami ayant provoqué l’effondrement de la centrale nucléaire de Fukushima Daiichi en 2011, l’équipe de SafeCast a cherché à collecter des données sur la radiation sur l’ensemble du territoire. Aujourd’hui, le site web de SafeCast est une base de données ouverte, permettant d’afficher, dans le monde entier, les taux de radiations collectés. L’équipe de SafeCast s’est réunie avec des ingénieurs pour élaborer des appareils qui mesurent les radiations. La plateforme est basée sur le volontariat des citoyens et citoyennes qui peuvent acquérir un appareil et alimenter la carte du monde avec leurs données. Ce site web permet donc une surveillance de l’environnement par une communauté.  

PublicLab est une autre plateforme similaire, qui a pour but de fonder une base de données en “open source” sur la recherche environnementale. Le site fonctionne sur un modèle appelé “community science”, qui permet à n’importe qui de contribuer à un savoir scientifique.  

En Suisse, nous pouvons aussi citer l’exemple de l’application EyesUp. Créée dans le but de lutter contre le harcèlement sexuel, cette application permet de donner un moyen d’action aux cibles, de documenter les actes de harcèlement, et de donner des ressources scientifiques et juridiques sur le sujet. L’ensemble des données collectées, à l’aide des utilisateurs et utilisatrices de l’application, permet de refléter un aspect de la réalité qui n’était, jusque-là, pas quantifié. Le rapport annuel de EyesUp leur permet de porter des revendications par rapport aux mesures de prévention, à la prise en charge des victimes, mais aussi à avoir pu mentionner explicitement la notion de harcèlement sexuel dans le code pénal. 

Dans son livre Data Action, Sarah Williams encourage la collecte participative des données. C’est une expérience pédagogique pour les différents acteurs et les différentes actrices impliqués, qui permet de travailler avec les communautés locales et de construire une confiance. Cela permet aussi de combler des lacunes dans les données collectées par le gouvernement et le secteur privé. 

Les dangers des dérives de la science des données 

La science des données a ouvert la porte à une multitude de possibilités d’amélioration du quotidien pour tous et toutes. Cependant, tout n’est pas rose, et certaines facettes de la science des données peuvent entraîner des répercussions négatives, qu’elles soient produites volontairement ou non. 

Dans son propre monde 

  Le premier exemple d’enjeux éthiques autour des données est celui de la captation de l’attention et des bulles d’enfermement sur internet. En effet, des algorithmes calculent les données de chaque internaute et font en sorte de maintenir chacun et chacune dans une bulle qui correspond à son profil, qui est dressé selon ses habitudes, ses recherches et son comportement sur les réseaux sociaux. Ces habitudes vont conditionner tout le contenu qui sera suggéré, sans consulter l’internaute. Cet enfermement est invisible, et il n’est pas appliqué de force, c’est l’internaute qui s’y jette. Les algorithmes enregistrent toutes nos activités sur internet, jusqu’au moindre “like” sur Facebook. Plus on est actif, plus on nourrit les algorithmes, et plus ils parviennent à trouver le contenu “parfait” pour nous. Cela abouti à une bulle d’enfermement sur mesure, proposant du contenu censé nous faire cliquer, afin de passer davantage de temps sur le réseau en question. Une grande partie du contenu disponible est donc invisibilisée, si jugée non pertinente pour l’usager ou l’usagère. Cette bulle fait voir à l’usager ou l’usagère le même monde selon ses habitudes de consommation matérielles et culturelles, et enferme aussi dans une bulle idéologique et politique. L’internaute se retrouve soumis à un “impératif algorithmique”. Cette enclosure cultive l’addiction de l’internaute aux réseaux sociaux. Les réseaux sociaux sont, de nos jours, la principale source d’information sur l’actualité pour les jeunes. Leur culture politique est donc très modelable par ces algorithmes. Il est déjà arrivé que ces bulles d’enfermement contribuent à la radicalisation de jeunes vers des idées à penchant extrémistes, par exemple.  

Quand l’économie s’en mêle 

Un autre cas d’application de la science des données sur internet concerne ce qu’on appelle en sciences économiques la “discrimination par les prix”. Celle-ci se manifeste lorsqu’un même fournisseur propose un bien ou un service à des prix différents, alors que le coût de production est toujours le même. Cela signifie que, selon certaines caractéristiques variables, les différents clientes et clients ne paieront pas le même prix. Ces variables peuvent être géographiques (un même livre acheté sur Amazon peut coûter plus cher en Suisse qu’en France) ou temporelles (les prix des billets d’avion sont vendus à un prix plus ou moins élevé selon la date du vol, et même selon si on le réserve le matin ou le soir). Seulement, la variable qui nous intéresse concerne les caractéristiques personnelles du client ou de la cliente. En effet, le prix peut varier en fonction de l’âge, du genre, du revenu ou des goûts personnels de la personne. Toutes ces caractéristiques vont être fournies grâce à “l’empreinte numérique” que chacun et chacune laisse en naviguant sur internet. Toutes les données personnelles qui vont être capturées lorsque nous surfons sur internet, les “cookies”, peuvent, ensuite, aider les algorithmes à déterminer quel prix nous sommes prêts à payer pour un bien ou un service spécifique. 

 Il y a aussi des données qui sont récoltées via les sites internet que nous consultons, qui informent sur nos goûts personnels et notre revenu. Par exemple, une personne qui commande beaucoup de produits coûteux sur internet, comme des vêtements de marque de luxe, a des chances de payer plus cher un article sur Amazon, par rapport à une personne qui fait des achats plutôt modestes. Les données techniques de nos appareils peuvent aussi révéler le type d’appareil utilisé et combien de fois nous avons visité le site, pour proposer des prix en fonction. Un client utilisant le dernier iPhone en date peut ainsi payer plus qu’un client qui utiliser un ancien PC. De nombreuses boutiques en lignes ont accès à ces données et en profitent. La question est de savoir si cette discrimination par les prix est justifiable ou non. Certains diront qu’elle est négative, car elle discrimine selon certains facteurs qui peuvent être imprécis, car évalués par des algorithmes, et que tout le monde devrait payer le même prix pour un même produit. D’autres y voient des aspects positifs, car en effet, cette discrimination peut permettre de trouver le prix adapté à chacun, et peut donc permettre à certaines personnes, ayant un revenu moins élevé, d’accéder à davantage de services. 

Les scandales 

De nombreux scandales liés aux données ont déjà fait l’actualité, comme le célèbre cas de l’entreprise “Cambridge Analytica”, accusée d’avoir utilisé les données des utilisateurs de Facebook pour influencer l’élection présidentielle américaine de 2016. Un autre cas concerne l’application WhatsApp, qui a été condamnée en 2021 à une amende de 225 millions d’euros à cause d’un manque de transparence concernant l’usage de données personnelles des utilisateurs et utilisatrices. On leur reproche un manque d’information concernant le consentement des utilisateurs et utilisatrices, le temps de conservation de leurs données, l’ambiguïté relative aux informations sur les conséquences de l’utilisation de l’application et un défaut de base légale relative au transfert de donnés vers des filiales comme Facebook. Tous ces cas nous montrent que nos données personnelles sont de plus en plus prisées par les entreprises, et qu’il faut être très vigilant vis-à-vis des sites internet et des applications que nous utilisons. Cependant, il ne faut pas voir le mal partout, car il est vrai que la science des données peut avoir des aspects très positifs, comme nous avons pu le voir. 

Conclusion 

Dans Data Action: Using Data for Public Good, Sarah Williams revendique de faire de la science des données “a tool for empowerment rather than oppression”. Cela passe par des actions, visant à la fois à réguler et encadrer les effets pervers de la science des données, et à promouvoir leur potentiel à contribuer au bien commun. 

Nous avons fait une sélection d’actions que différents acteurs et actrices peuvent promouvoir pour aller dans ce sens.  

Actions individuelles 


  • Prendre le temps de paramétrer les cookies sur les sites internet 
  • Être vigilant et vigilante vis-à-vis du contenu partagé en ligne 
  • Entraîner sa vigilance vis-à-vis du contenu personnalisé: faire l’effort de chercher des points de vue et des sources divers et fiables 
  • Participer à des formations, des hackathons, …  

Actions académiques


  • Former les étudiants et étudiantes aux enjeux de la science des données dans leur domaine de spécialisation  
  • Organiser des cours, des conférences, des séminaires, ou encore des stands de prévention, dans toutes les facultés  
  • Encourager les étudiants et étudiantes à récolter des données “manquantes” (pollution, discrimination, racisme, sexisme, validisme, …) pour attirer l’attention du public et être moteur de changement 
  • Utiliser la science des données pour l’optimisation énergétique des bâtiments de l’université 

Actions de l’administration publique


  • Faire des évènements dans les quartiers pour informer les personnes souffrant de la fracture numérique (par exemple les personnes âgées)  
  • Veiller à ce que le droit protège la santé des travailleurs et travailleuses et promeuve l’égalité des chances 
  • Revendiquer et défendre le droit à la transparence 
  • Veiller à ce que les citoyens et citoyennes comprennent et puissent contester les décisions prises par des algorithmes 
  • Donner la possibilité aux citoyens et citoyennes de proposer des sujets d’étude statistiques 
  • Renforcer les lois existantes sur la protection des données (LPD, RGPD). 
  • Utiliser la science des données pour optimiser les dépenses publiques (énergie, ressources humaines, …) 
  • Utiliser la science des données pour assurer une répartition équitable des mandats 

Actions de l’industrie


  • Créer un code de conduite accepté au sein de l’industrie 
  • Qui est représenté dans le corpus de données ?  
  • Qui manque à l’appel ? Des minorités ethniques ? De genre ? Des groupes d’âge ? Des groupes sociaux-économiques ? 
  • Les décisions prises par l’algorithme vont-elles renforcer des inégalités ou les atténuer ? 
  • Peut-on anticiper des effets pernicieux ?  
  • L’algorithme peut-il être détourné par des personnes malintentionnées ?  
  • À quelle échelle cette technologie va-t-elle être déployée ? Est-il possible de mettre en place des technologies à des échelles plus locales ? 
  • Proposer des formations aux employées et employés travaillant avec la science des données 

Pour aller plus loin et approfondir vos connaissances sur le sujet, nous vous encourageons à visiter notre rubrique “Aller plus loin”