Des données pour changer le monde

December 01, 2016

Image
Deux mains tiennent un téléphone.

CRDI / Minzayar Oo

Les données ouvertes pourraient améliorer les communications.

Naël Shiab

« En Côte d’Ivoire, quand une femme quitte la maison pour aller accoucher, ses proches commencent leur deuil tout de suite, parce qu’ils ne savent pas si la mère ou le bébé reviendront vivants, lance Nnenna Nwakanma, coordonnatrice de la Web Foundation en Afrique. Y aura-t-il de la place à l’hôpital ? Y aura-t-il des médicaments ? Ou même un obstétricien en poste ? Cette femme ne le sait pas et, quand elle arrive, il est parfois trop tard pour se rendre dans un autre établissement. Mais si les établissements étaient connectés et partageaient leurs informations, elle saurait vers lequel se diriger. Avec les données ouvertes, nous pouvons sauver des vies. »

Dans l’immense salle du centre des congrès de Madrid, les membres de l’assemblée restent sans voix. Fonctionnaires, entrepreneurs, militants, programmeurs, journalistes, ils sont plus d’un millier à avoir convergé, en octobre, vers la capitale espagnole pour l’International Open Data Conference, persuadés de pouvoir contribuer à un monde meilleur grâce aux données ouvertes. Et sur scène, Nnenna Nwakanma, dans son habit traditionnel multicolore aux multiples drapés, vient de prononcer le plus vibrant plaidoyer qui soit.

Les données ouvertes, nous les utilisons quotidiennement sans nous en rendre compte. Lorsque nous consultons la météo ou planifions notre prochain déplacement au moyen de notre téléphone intelligent, par exemple. Accessibles à tous et partageables a volonté, elles nous simplifient la vie. Rien de bien extraordinaire au premier abord.

Sauf que, aux quatre coins du monde, des geeks citoyens ont décidé de faire de ce concept d’accessibilité apparemment inoffensif un fantastique outil de transformation sociale. Les données ouvertes forcent désormais les États à rendre des comptes, révèlent au grand jour des entreprises corrompues et améliorent la vie de la population.

Guérilleros de l’intérêt public, les adeptes de cette philosophie numérique tentent de libérer les données stockées sur les serveurs de leur gouvernement et les exploitent pour le bien commun. C’est le cas d’Adram Huyser-Honig, qui travaillait jusqu’à tout récemment pour Transparency International au Honduras, un organisme sans but lucratif qui lutte contre la corruption. Dans une salle du centre des congrès de Madrid, quelques dizaines de personnes assistent à sa présentation. Le jeune homme raconte comment il a mis au jour un système de fraude dans l’approvisionnement en médicaments de ce pays d’Amérique centrale. « Le gouvernement dispose d’un budget annuel d’environ 40 millions de dollars et il rend publics les achats qu’il fait, explique-t-il, tandis que ses notes défilent derrière lui sur un écran. Mais les appels d’offres et les factures sont dans des proformats différents, ce qui rend impossible toute vue d’ensemble. »

Avec ses collègues de l’Asociacíon para una Sociedad más Justa (association pour une société plus juste), un OSBL du Honduras, il s’est attelé à la fastidieuse tâche de télécharger, trier, uniformiser puis analyser les documents depuis 2004. Ils ont découvert que l’entreprise Astropharma, qui n’avait aucun contrat avec l’État avant 2009, s’était subitement mise à engranger des millions de dollars les années suivantes. Vérification faite, l’entreprise appartenait à la vice-présidente du Congrès, Lena Gutierrez, en politique depuis... 2009. Après ces révélations, des manifestations ont secoué le pays, ou l’accès aux soins des huit millions d’habitants est très limité. L’affaire est maintenant devant les tribunaux. De son côté, Adram Huyser-Honig a publié sur le Web l’ensemble des données triées. Désormais, d’un simple clic, n’importe quel internaute peut télécharger un fichier Excel, observer à son tour la moindre opération et, qui sait, découvrir de nouvelles fraudes. Dans le jargon de la communauté, c’est ce qu’on appelle « la libération des données ».

Les apôtres de cette doctrine souhaitent un monde basé sur la transparence, où l’ensemble de la population a le pouvoir de remettre en question l’autorité établie. L’objectif n’est pas de clouer le gouvernement au pilori, comme le ferait un parti d’opposition ; il s’agit au contraire de l’aider à mieux fonctionner pour le bien commun. « Il faut changer les mentalités des têtes dirigeantes et les pousser à l’ouverture, soutient Ania Calderón, responsable des données ouvertes au sein du cabinet du président du Mexique. Un citoyen informé et engagé devrait être le meilleur allié d’un gouvernement. Parce que, soyons honnêtes, un gouvernement seul ne sera jamais capable de combattre la corruption ou le réchauffement climatique. » Et toute cette démarche de « libération des données » est intiment liée à la nature du Web. Quoi de mieux qu’Internet pour distribuer à volonté de l’information, sans censure ni discrimination ?

Chaque fois qu’un élu en Occident voyage aux frais de l’État, qu’un médecin est payé par les contribuables ou qu’un policier dresse une contravention, tout cela est enregistré dans de gigantesques bases de données mises à jour par les pouvoirs publics. Les militants numériques pensent que tous les citoyens devraient y avoir accès, directement à partir de leur navigateur Web. Votre député se fait-il rembourser des voyages d’agrément ? Votre médecin de famille prescrit-il davantage d’antibiotiques que ses confrères ? Les policiers de votre quartier font-ils du profilage racial ? Avec les données ouvertes, la réponse à ces questions serait à quelques clics. Et des solutions émanant de la société civile pourraient être proposées.

Dans un monde idéal, les autorités publieraient elles-mêmes les données en leur possession. En France, par exemple, depuis le 6 octobre, les municipalités de plus de 3 600 habitants sont obligées de le faire. « Le challenge est énorme, mais il y a chez nous un intérêt pour la transparence qui date de la Révolution, explique Jean-Marie Bourgogne, directeur d’Open Data France. Déjà, dans la Déclaration des droits de l’homme, un article disait que tout citoyen pouvait demander des comptes à l’État. Cette notion de responsabilité est vieille de plus de 200 ans. » Mais les États sont-ils prêts à rendre accessibles des informations qui les mettraient potentiellement dans le pétrin ? Si la France a récemment fait des pas de géant en matière d’ouverture, ce n’est pas sans avoir d’abord trébuché.

En 2011, le Parlement français décide de forcer les entreprises pharmaceutiques à déclarer tous les cadeaux offerts et contrats accordés aux professionnels de la santé, médecins, chirurgiens et infirmiers. Ces informations devaient figurer sur un site Web public que chaque personne pouvait consulter. Mais, deux ans plus tard, le résultat est décevant. « Seule la valeur des cadeaux était indiquée sur le site, dit François Massot, de l’association d’ingénieurs et d’informaticiens Regards citoyens, présent à la conférence de Madrid. C’était très limité, on ne pouvait faire des recherches qu’à partir du nom d’un médecin, un médecin à la fois. C’est à ce moment-là que des acteurs du domaine de la santé nous ont appelés à l’aide. »

François Massot est lui-même développeur. « Nous avons programmé des logiciels sur mesure qui ont extrait et réorganisé automatiquement toutes les informations du site. Ça nous a pris deux ans. » Mais ce travail de fourmi a fini par payer. En avril 2015, François Massot et ses confrères libèrent la base de données au complet sur le site de Regards citoyens. L’ampleur des liens entre les professionnels de la santé et les laboratoires pharmaceutiques est alors exposée au grand jour : en deux ans et demi, les sociétés pharmaceutiques ont offert 2 500 000 cadeaux, pour une valeur totale de 245 millions d’euros. Et ce n’est probablement que la pointe de l’iceberg : 235 000 contrats ont aussi été conclus durant la même période, pour des sommes qui restent inconnues. « Ce dont on est très fiers, c’est que les citoyens, les journalistes et les politiciens ont tous réutilisé nos données, indique François Massot. Le débat est revenu sur la scène publique. »

Au fil des séances, ateliers et présentations de l’International Open Data Conference (voir la Des geeks et des Canadiens ci-dessous), les exemples inspirants se succèdent. Oludotun Babayemi, 34 ans, cofondateur de Follow the Money Nigeria (ou va l’argent au Nigeria), explique comment il utilise les données budgétaires de son pays et les données ouvertes sur l’aide internationale pour s’assurer que l’argent promis est bel et bien utilisé dans les villages les plus démunis. Kirikowhai Mikaere, de la Nouvelle-Zélande, détaille le plan des Maoris, qui souhaitent produire leurs propres données ouvertes pour sensibiliser le pouvoir central a leurs défis, et organiser des data schools afin que les futures générations prennent des décisions éclairées en toute indépendance. Jameson Lopez, membre de la tribu Kwat’san et doctorant à l’Université d’État de l’Arizona, a établi une méthode de recensement plus juste pour les Premières Nations des États-Unis, souvent invisibles dans les statistiques officielles en raison de leur faible nombre. Au lieu de les recenser selon leur lieu de résidence, il propose de le faire en fonction de leurs liens héréditaires et culturels.

Pour chacun de ces succès inspirants, combien y a-t-il eu d’échecs ? En août, le gouvernement australien a publié une base de données contenant les réclamations médicales faites par environ deux millions de personnes de 1984 à 2014. Traitements de maladies sexuellement transmissibles, avortements et autres : l’information est hautement confidentielle, mais le gouvernement espérait bénéficier de l’intelligence collective pour mettre le doigt sur des problèmes dans le système de santé que ses fonctionnaires n’auraient pas relevés. Par respect de la vie privée, les noms des patients, des médecins et des établissements ont été anonymisés par le ministère de la Santé. A l’aide d’un logiciel, ces informations ont été remplacées par des identifiants choisis au hasard.

En septembre, toutefois, trois chercheurs en informatique de l’Université de Melbourne ont décidé de tester l’efficacité des méthodes d’anonymisation utilisées. En trois jours, ils ont trouvé une faille et ont réussi à réidentifier les médecins. Ils ont alerté le gouvernement, qui a immédiatement retiré la base de données, déjà téléchargée à 1 500 reprises par des chercheurs, des compagnies d’assurances, mais aussi... de parfaits inconnus. La loi sur la vie privée a été modifiée pour interdire la réidentification, même si les experts mettent en doute l’efficacité d’une telle mesure.

Alors, comment protéger la vie privée des gens tout en respectant leur droit à l’information ? « Cela est d’autant plus problématique que des gouvernements utilisent cette zone floue pour éviter d’avoir à rendre des comptes », dit Helen Darbishire, directrice d’Access Info Europe. La militante a récemment demandé à la Commission européenne la liste de toutes les dépenses de voyage et d’hébergement des commissaires. L’institution lui a remis tous les détails, sauf... le nom des politiciens ! « Les responsables m’ont dit que cette information était d’ordre personnel et le problème est qu’ils ont théoriquement raison. Mais où est la limite entre la vie privée et la vie publique ? »

La question devient encore plus complexe quand on ajoute le droit à l’oubli. En 2014, la Cour de justice de l’Union européenne a accordé ce droit aux Européens sur le Web. Concrètement, ils peuvent exiger de Google, par exemple, que certains sites soient exclus des résultats d’une recherche faite à partir de leur nom. Le but est d’éviter que des informations personnelles inexactes, dommageables pour la personne ou sans intérêt public ne soient affichées par les moteurs de recherche. Mais ce droit devrait-il être accordé quand il s’agit de données ouvertes ?

« Cette question, très importante, est en ce moment devant les tribunaux européens », mentionne Krzysztof Izdebski, 35 ans, qui travaille pour la fondation polonaise ePaństwo, qui promeut l’engagement civique. L’homme d’affaires italien Salvatore Manni, dont la société a fait faillite en 1995, est au cœur de ce débat. Plus de 20 ans après, les détails le concernant se trouvent toujours dans le registre des entreprises de sa région, accessible à tout un chacun. Des entreprises privées utilisent ces données ; elles les regroupent, les analysent, puis les vendent. Salvatore Manni dit en pâtir et demande que ses informations soient effacées ou anonymisées.

« Ce genre de cas peut réduire à néant tous les progrès d’ouverture qui ont été faits ces dernières années, estime Krzysztof Izdebski. Imaginez qu’un ancien candidat d’extrême droite battu aux élections il y a 20 ans demande qu’on efface des données le concernant et que, l’année suivante, il se présente pour le Parti vert. Est-ce une question de vie privée ? Ma réponse est non. C’est une question de responsabilité publique. » Et comment appliquer une telle mesure si les données ont déjà été téléchargées par des milliers d’anonymes ?

« Nous croyons que les données ouvertes ont le potentiel d’améliorer la vie des gens. Comment ? Cela n’est pas encore très clair », constate Naser Faruqui, directeur des technologies et de l’innovation au Centre de recherches pour le développement international (CRDI) du Canada, partenaire dans l’organisation de la conférence. Si le potentiel est énorme pour la transparence des institutions publiques et la gouvernance des démocraties, il ne faut pas oublier pour autant les gigantesques quantités de données détenues par les entreprises privées, souligne-t-il. « Nous devons penser à des mesures qui les inciteront à les libérer aussi. »

Il donne pour exemple le Sri Lanka, ou le CRDI mené un programme avec les entreprises de téléphonie cellulaire. Amorcé en mars 2015, ce programme de deux ans dispose d’un budget de 725 000 dollars. « Nous les aidons à mettre en place des principes directeurs en matière de vie privée en échange des données anonymisées sur le suivi des déplacements des téléphones. Cette information a permis d’effectuer une étude sur la circulation dans les rues de la capitale, Colombo, et de l’améliorer. Les données gouvernementales ne sont qu’une partie de l’équation. »

Des entreprises utilisent aussi des données ouvertes pour faire des affaires. Aux États-Unis, des sociétés téléchargent des données liées à l’immobilier, les traitent, les analysent, puis les revendent a des agences. « Ces sociétés valent plus d’un milliard de dollars au moment où l’on se parle », indique Naser Faruqui.

Au cours des dernières années, le Canada, le Québec et des villes ont mis en place des portails de données ouvertes à partir desquels les gens peuvent télécharger toutes sortes d’informations et les utiliser à leur guise. « Un de mes exemples favoris, dit Ashley Casovan, directrice du portail du Gouvernement ouvert du Canada, c’est une application qui a été créée pour aider les nouveaux arrivants à choisir la meilleure ville ou s’établir. Communautés culturelles, langue, climat, taille de la ville, activités : l’application leur pose des questions et détermine ensuite les municipalités qui leur conviennent le mieux. Et une fois arrivés, les nouveaux résidants sont connectés avec les services sur place grâce à l’application. Les données ouvertes de14 ministères et agences gouvernementales sont utilisées à ces fins. »

Le fédéral a aussi procédé, en 2016, a un grand inventaire de toutes les bases de données en sa possession, une première ! Au cours des prochains mois, Ashley Casovan et son équipe inviteront les Canadiens à voter sur les données à libérer.

« La fermeture et le secret peuvent représenter de grands risques pour la société », soutient Mar Cabra, directrice de l’équipe de recherche du Consortium international des journalistes d’enquête, à Washington. L’Espagnole d’origine a travaillé pendant des mois sur le scandale des Panama Papers. En 2015, une source anonyme a remis au quotidien allemand Süddeutsche Zeitung des millions de documents appartenant au cabinet d’avocats panaméen Mossack

Fonseca, ce qui a permis de lever le voile sur des centaines de milliers d’entreprises extraterritoriales et leurs propriétaires. « Nous avons trouvé des entreprises qui étaient sur la liste noire des États-Unis pour avoir, par exemple, financé des organisations terroristes. Elles étaient pourtant actives dans le pays grâce au secret bancaire. »

Quelques mois plus tard, nouvelle fuite de documents, cette fois en provenance des Bahamas. Une source anonyme remet au Süddeutsche Zeitung le registre de toutes les entreprises enregistrées dans ce paradis fiscal, avec le nom de leurs administrateurs. « On a notamment découvert que Neelie Kroes, commissaire européenne à la concurrence [de 2004 a 2010] et responsable du programme numérique [de 2010 a 2014], avait siégé au conseil d’administration de la société bahamienne Mint Holdings de 2000 à 2009. Cette entreprise avait été mise sur pied dans le but d’acquérir des actifs dans le secteur de l’énergie. Les commissaires doivent déclarer ce genre d’activité et elle ne l’avait pas fait, ce qui est très grave. Si le registre avait été ouvert, ça ne se serait pas passé comme ça », dit Mar Cabra. Depuis, les données ont été libérées et sont accessibles sur le site du Consortium.

N’en demande-t-on pas un peu trop aux données ouvertes ? Sont-elles vraiment la panacée numérique du XXIe siècle ? « Pour être honnête, les objectifs que nous nous fixons me causent de l’anxiété, concédait Karin Christiansen, présidente d’Open Knowledge et fondatrice de

Publish What You Fund (dévoilez ce que vous financez), dans son allocution devant les centaines de participants à la conférence Open Data. Je ne sais pas si on va y arriver. Les données ouvertes ne réduisent pas la pauvreté et ne combattent pas la corruption. Ce sont les gens qui, en les utilisant, peuvent changer les choses. » Et les gens, chers lecteurs, c’est vous.

Des geeks et des Canadiens

Informaticiens, politiciens, fonctionnaires, responsables de fondations et d’organismes sans but lucratif… Ils étaient plus d’un millier à participer à l’International Open Data Conference de Madrid, en octobre 2016.

« Le potentiel est là, pour les données ouvertes. Il y a des preuves qu’elles peuvent améliorer la vie des gens en offrant davantage de transparence et d’obligation de rendre des comptes de la part des États, indique Naser Faruqui, directeur des technologies et de l’innovation au Centre de recherches pour le développement international (CRDI) du Canada. Nous croyons qu’il y aurait aussi des occasions d’affaires et de croissance économique dans ces pays-là. »

Avec la Banque mondiale et le gouvernement espagnol, le CRDI est l’un des trois principaux organisateurs de l’International Open Data Conference (la rencontre précédente, en 2015, a d’ailleurs eu lieu à Ottawa).

Société d’État canadienne créée en 1970 par le Parlement fédéral, le CRDI finance des recherches et des programmes pour aider au développement économique des pays du Sud.

Il mène également le Partenariat mondial sur les données ouvertes pour le développement, qui dispose d’un budget de 2,5 millions de dollars.

Il soutient des expériences de données ouvertes en Afrique, en Asie, en Europe de l’Est et en Amérique latine, pour aider les habitants de pays moins nantis à tirer profit, eux aussi, d’un monde de plus en plus numérique. « Notre vision est que la connaissance et l’innovation peuvent apporter des solutions pour améliorer la vie des gens dans les pays en voie de développement », explique Naser Faruqui.

Naël Shiab a assisté à l’International Open Data Conference, qui s’est tenue à Madrid du 4 au 7 octobre. Il y avait été invité par le CRDI, partenaire dans l’organisation de la rencontre.

Cet article a été publié initialement dans l'édition de décembre 2016 du magazine L’Actualité