Guide du datajournalisme
132 pages
Français

Vous pourrez modifier la taille du texte de cet ouvrage

Guide du datajournalisme , livre ebook

-

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
132 pages
Français

Vous pourrez modifier la taille du texte de cet ouvrage

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Au travers d'expériences récentes au sein de rédactions du monde entier, des USA à l'Argentine en passant par la France ou l'Allemagne, cet ouvrage dresse un panorama des pratiques du datajournalisme aujourd'hui et donne des repères pour ceux qui veulent se lancer dans cette nouvelle branche du journalisme, à la croisée de l'investigation, du développement et du graphisme.



Destinée aux étudiants en journalisme et aux professionnels en activité qui souhaitent se former à cette nouvelle discipline, cette version française du Data Journalism Handbook s'enrichit d'exemples issus de médias français ou francophones (Le Monde, Rue89, OWNI, France Info, L'Avenir...).



Ouvrage réalisé à l'initiative de l'European Journalism Centre (www.ejc.net/) et de l'Open Knowledge Foundation (http://okfn.org/), publié sous la direction de Jonathan Gray, Liliana Bounegru et Lucy Chambers pour la version originale et de Nicolas Kayser-Bril pour la version française.




  • Dans la salle de rédaction


  • Etudes de cas


  • Obtenir des données


  • Comprendre les données


  • Publier des données

Sujets

Informations

Publié par
Date de parution 22 août 2013
Nombre de lectures 151
EAN13 9782212246209
Langue Français
Poids de l'ouvrage 7 Mo

Informations légales : prix de location à la page 0,0135€. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.

Exrait

R sum
Collecter, analyser et visualiser les données
Au travers d’expériences récentes au sein de rédactions du monde entier, des USA à l’Argentine en passant par la France ou l’Allemagne, cet ouvrage dresse un panorama des pratiques du datajournalisme aujourd’hui et donne des repères pour ceux qui veulent se lancer dans cette nouvelle branche du journalisme, à la croisée de l’investigation, du développement et du graphisme.
Destinée aux étudiants en journalisme et aux professionnels en activité qui souhaitent se former à cette nouvelle discipline, cette version française du Data Journalism Handbook s’enrichit d’exemples issus de médias français ou francophones ( Le Monde , Rue89, OWNI, France Info, L’Avenir …).

Au sommaire
1. Dans la salle de rédaction
2. Études de cas
3. Obtenir des données
4. Comprendre les données
5. Publier des données
Biographie auteur
Ouvrage réalisé à l’initiative de l’European Journalism Centre ( www.ejc.net/ ) et de l’Open Knowledge Foundation ( http://okfn.org/ ), publié sous la direction de Jonathan Gray, Liliana Bounegru et Lucy Chambers pour la version originale et de Nicolas Kayser-Bril pour la version française.
www.editions-eyrolles.com
GUIDE DU
DATAJOURNALISME
Collecter, analyser et visualiser les données
Sous la direction de
Jonathan Gray, Liliana Bounegru, Lucy Chambers
et de
Nicolas Kayser-Bril
pour la version française
Chez le même éditeur
N. Yau, Data visualisation – De l’extraction des données à leur représentation , à paraître.
D. Rosenberg et A. Grafton, Cartographie du temps , 272 p., 2013.
M. Lima, Cartographie des réseaux , 272 p., 2013.
Groupe Eyrolles
61, bd Saint-Germain
75240 Paris Cedex 05
www.editions-eyrolles.com
Traduction autorisée du Data Journalism Handbook , ouvrage réalisé à l’initiative de l’European Journalism Centre ( www.ejc.net/ ) et de l’Open Knowledge Foundation ( http://okfn.org/ ) et publié en 2012 par O’Reilly (ISBN 978-1-4493-3006-4). Une version en ligne de cet ouvrage est disponible gratuitement sous licence Creative Commons Attribution-ShareAlike à l’adresse www.datajournalismhandbook.org
Le Guide du datajournalisme peut être copié, diffusé et réutilisé gratuitement selon les termes de la licence Creative Commons Attribution-ShareAlike. Les contributeurs du Guide du datajournalisme conservent le droit d’auteur sur leurs contributions respectives et ont aimablement accepté de les libérer sous les termes de cette licence.
La version originale en anglais a été dirigée par Jonathan Gray, Liliana Bounegru et Lucy Chambers.
La version française publiée par les éditions Eyrolles a été dirigée par Nicolas Kayser-Bril.
Traduit et adapté de l’anglais par Charles Robert.
Mise en pages : Sandrine Escobar
Attention : la version originale de cet ebook est en couleur, lire ce livre numérique sur un support de lecture noir et blanc peut en réduire la pertinence et la compréhension.
© Groupe Eyrolles, 2013, pour l’édition en langue française
ISBN 978-2-212-13685-2
Sommaire
Préface
Contributeurs
Ce qu’est ce livre (et ce qu’il n’est pas)
1 Introduction
Qu’est-ce que le datajournalisme ?
Pourquoi les journalistes doivent utiliser des données
Pourquoi le datajournalisme est-il important ?
Quelques exemples du genre
Le datajournalisme en perspective
2 Dans la salle de rédaction
Datajournalisme à la BBC
Comment fonctionne l’équipe des applications d’information du Chicago Tribune
Dans les coulisses du Guardian Datablog
Datajournalisme au Zeit Online
Comment recruter un hacker
Aller chercher les talents dans les hackathons
Suivre les flux financiers : datajournalisme et collaboration internationale
Nos histoires sont du code
Kaas & Mulvad : contenu semi-fini pour groupes d’influence
Créations d’applis à Rue89
Modèles économiques de datajournalisme
3 Études de cas
Le fossé des opportunités
Une enquête de neuf mois sur les fonds structurels européens
Aspirer les données d’Ameli
Contrôler les dépenses publiques avec OpenSpending.org
Une pige de « scraping olympique »
Hack électoral en temps réel (Hacks/Hackers Buenos Aires)
Crowdsourcing : l’accès à la TNT dans le sud-est de la France
Le hackathon Mapa76

La couverture des émeutes au Royaume-Uni par le Guardian Datablog
Évaluer les écoles de l’Illinois
Contrôler les factures d’hôpitaux
Le Véritomètre
Le téléphone omniscient
Quel modèle de voiture ? Taux d’échec au contrôle technique
Le subventionnement des bus en Argentine
Comment Regards Citoyens a créé NosDéputés.fr, base de données de l’activité parlementaire
Le grand tableau des élections
Crowdsourcing du prix de l’eau
4 Obtenir des données
Guide de référence rapide
Votre droit d’accès aux données publiques
Le wobbing, ça marche !
Recueillir des données sur le Web
Le Web comme source de données
Le crowdsourcing de données au Guardian Datablog
Utiliser et partager des données : la loi, les petits caractères et la réalité
5 Comprendre les données
Se former aux données en trois étapes simples
Notions de base pour travailler avec des données
Histoires de données
Les datajournalistes parlent de leurs outils préférés
Utiliser la visualisation pour faire parler les données
6 Publier des données
Présenter des données au public
Concevoir une application d’information
Applications d’actualité chez ProPublica
La visualisation, meilleur outil du datajournaliste
Utiliser la visualisation des données pour raconter des histoires
Différents graphiques pour différents angles
Visualisation de données maison : nos outils préférés
Comment nous publions nos données au Verdens Gang
Données publiques sur les réseaux sociaux
Impliquer les gens autour de ses données
À propos des directeurs d’ouvrage
À propos des coordinateurs du projet
Préface
Aux illustres anonymes
La version originale du Guide du datajournalisme est née au cours d’un atelier organisé par le Centre européen du journalisme et l’Open Knowledge Foundation lors du MozFest 2011, à Londres. Il s’est par la suite développé en une vaste collaboration internationale impliquant des douzaines de spécialistes et de partisans du datajournalisme.

Comment tout a commencé .
Au cours des six mois qui se sont écoulés entre la naissance de ce livre et sa première parution complète, des centaines de personnes y ont contribué de diverses façons. Bien que nous nous soyons efforcés de garder une trace de chacune d’entre elles, nous avons reçu bon nombre de contributions anonymes, intraçables ou sous pseudonyme.

À toutes les personnes qui ont contribué à ce livre et qui ne sont pas citées ci-dessous, nous souhaitons dire deux choses. Tout d’abord, merci. Ensuite, pouvez-vous nous dire qui vous êtes pour recevoir les remerciements qui vous sont dus ?
Contributeurs
Les personnes suivantes ont contribué au brouillon ou à la version actuelle du texte de ce livre (et les illustrations sont l’œuvre de la graphiste Kate Hudson) :
• Jean Abbiateci, journaliste indépendant
• Gregor Aisch, Open Knowledge Foundation
• Brigitte Alfter, Journalismfund.eu
• David Anderton, journaliste indépendant
• James Ball, The Guardian
• Caelainn Barr, Citywire
• Karen Bastien, WeDoData
• Mariana Berruezo, Hacks/Hackers Buenos Aires
• Michael Blastland, journaliste indépendant
• Mariano Blejman, Hacks/Hackers Buenos Aires
• John Bones, Verdens Gang
• Marianne Bouchart, Bloomberg News
• Liliana Bounegru, Centre européen du journalisme
• Brian Boyer, The Chicago Tribune
• Paul Bradshaw, université de Birmingham
• Wendy Carlisle, Australian Broadcasting Corporation
• Lucy Chambers, Open Knowledge Foundation
• Jean-Marie Charon, professeur à l’EHESS
• Sarah Cohen, université de Duke
• Marie Coussin, Ask Media
• Alastair Dant, The Guardian
• Helen Darbishire, Access Info Europe
• Chase Davis, Center for Investigative Reporting
• Steve Doig, Walter Cronkite School of Journalism, Arizona State University
• Lisa Evans, The Guardian
• Tom Fries, Bertelsmann Stiftung
• Duncan Geere, Wired UK
• Jack Gillum, Associated Press
• Jonathan Gray, Open Knowledge Foundation

• Fanny Hardy, Le Dauphiné Libéré
• Alex Howard, O’Reilly Media
• Bella Hurrell, BBC
• Nicolas Kayser-Bril, Journalism++
• John Keefe, WNYC
• Scott Klein, ProPublica
• Alexandre Léchenet, Le Monde
• Mark Lee Hunter, INSEAD
• Andrew Leimdorfer, BBC
• Friedrich Lindenberg, Open Knowledge Foundation
• Mike Linksvayer, Creative Commons
• Mirko Lorenz, Deutsche Welle
• Esa Mäkinen, Helsingin Sanomat
• Jean-Marc Manach, journaliste d’investigation
• Pedro Markun, Transparência Hacker
• Isao Matsunami, Tokyo Shimbun
• Lorenz Matzat, OpenDataCity
• Geoff McGhee, université de Stanford
• Philip Meyer, professeur émérite de l’université de la Caroline du Nord à Chapel Hill
• Claire Miller, WalesOnline
• Cynthia O’Murchu, Financial Times
• Oluseun Onigbinde, BudgIT
• Djordje Padejski, Knight Journalism Fellow, université de Stanford
• Jane Park, Creative Commons
• Angélica Peralta Ramos, La Nación (Argentine)
• Cheryl Phillips, The Seattle Times
• Aron Pilhofer, The New York Times
• Lulu Pinney, infographiste indépendant
• Paul Radu, Organised Crime and Corruption Reporting Project
• Regards Citoyens
• Simon Rogers, The Guardian
• Pierre Roméra, Journalism++
• Martin Rosenbaum, BBC
• Amanda Rossi, Friends of Januária
• Martin Sarsale, Hacks/Hackers Buenos Aires
• Fabrizio Scrollini, London School of Economics and Political Science
• Sarah Slobin, The Wall Street Journal
• Sergio Sorin, Hacks/Hackers Buenos Aires

• Jonathan Stray, The Overview Project
• Brian Suda, (optional.is)
• Chris Taggart, OpenCorporates
• Jer Thorp, The New York Times R&D Group
• Andy Tow, Hacks/Hackers Buenos Aires
• Luk N. Van Wassenhove, INSEAD
• Sascha Venohr, Zeit Online
• Jerry Vermanen, NU.nl
• César Viana, université de Goiás
• Farida Vis, université de Leicester
• Pete Warden, analyste de données et développeur indépendant
• Arnaud Wéry, L’Avenir
• Chrys Wu, Hacks/Hackers
Ce qu’est ce livre (et ce qu’il n’est pas)
Ce livre est destiné à être une ressource utile pour tous ceux qui pensent devenir datajournaliste ou qui s’intéressent simplement à la discipline.
Beaucoup de gens ont contribué à son écriture et nous nous sommes efforcés de faire ressortir leur voix et leurs opinions diverses. Nous souhaitions qu’il se lise comme une conversation riche et instructive sur le datajournalisme, les raisons et la manière de le pratiquer.
Malheureusement, le simple fait de lire ce livre ne vous apportera pas toutes les connaissances et les compétences requises pour devenir datajournaliste. Cela demanderait une énorme bibliothèque gérée par des centaines d’experts capables de répondre à des questions diverses sur des centaines de sujets différents. Par chance, cette bibliothèque existe : elle s’appelle Internet. Nous espérons plutôt que ce livre vous donnera une idée ce qu’il faut faire pour commencer et des pistes à explorer si vous voulez creuser le sujet. Les exemples et les tutoriels sont fournis à titre indicatif et n’ont pas pour but d’être exhaustifs.
Nous avons eu la chance de bénéficier du temps, de l’énergie et de la patience de tous nos contributeurs et nous nous sommes efforcés de les utiliser à bon escient. Nous espérons qu’en plus d’être une source de référence utile, ce livre saura documenter la passion, l’enthousiasme, la vision et l’énergie d’un mouvement naissant. Nous souhaitons donner une idée de ce qui se passe en coulisses.
Le Guide du datajournalisme est une œuvre inachevée. Si vous relevez quoi que ce soit qui manque ou qui devrait être modifié, veuillez nous le signaler pour la prochaine version. Il est également gratuitement disponible sous licence Creative Commons Attribution-ShareAlike à l’adresse www.datajournalismhandbook.org et nous vous incitons fortement à le partager avec quiconque pourrait y trouver un intérêt.
Jonathan Gray, Open Knowledge Foundation ( @jwyg ), Liliana Bounegru, Centre européen du journalisme ( @bb_liliana ) et Lucy Chambers, Open Knowledge Foundation ( @lucyfedia ), mars 2012
En adaptant le Datajournalism Handbook en français, nous avons donné la parole à celles et à ceux qui innovent dans le journalisme francophone. Ils apportent des éclairages locaux qui montrent qu’il est possible de faire du journalisme autrement, que l’on soit à New York ou à Huy, ville wallonne de 20 000 habitants où travaille Arnaud Wéry.
Les rédactions de référence, comme Le Monde , tout comme les pure players comme Rue89 ou des associations engagées comme Regards Citoyens, partagent ici leurs techniques et leurs modes opératoires. Notre objectif a été de montrer en détail comment les projets de datajournalisme y étaient mis en œuvre pour donner des repères et des clés à ceux qui hésitent encore à se lancer. Nous avons aussi voulu illustrer le fait que, contrairement aux préjugés, les journalistes francophones sont nombreux à prendre des risques, à inventer et à renouveler leur industrie. Ce livre atteste que nous n’en sommes qu’au début.
Nicolas Kayser-Bril, cofondateur de Journalism++ ( @nicolaskb )


Le Guide du datajournalisme d’un coup d’œil : l’infographiste Lulu Pinney a créé ce poster qui donne une vue d’ensemble du contenu de ce livre .
Chapitre 1
Introduction
Qu’est-ce que le datajournalisme ? Quel est son potentiel ? Quelles sont ses limites ? D’où vient-il ? Dans cette section, nous allons tenter de le définir et de déterminer ce qu’il peut signifier pour les organisations de presse. Paul Bradshaw (université de Birmingham) et Mirko Lorenz (Deutsche Welle) nous parleront un peu de ce qui caractérise cette utilisation des données dans les médias. Des datajournalistes éminents nous expliqueront ce qui fait selon eux l’importance de leur discipline et nous feront part de leurs exemples préférés. Pour finir, Liliana Bounegru (Centre européen du journalisme) replacera le datajournalisme dans un contexte historique plus global .


Qu’est-ce que le datajournalisme ?
Qu’est-ce que le datajournalisme ? Je pourrais simplement répondre que c’est du journalisme de données. Mais cela ne nous avancerait pas beaucoup.
Les mots « données » et « journalisme » sont tous deux des termes à sens multiples. Certaines personnes voient les « données » comme un paquet de nombres, le plus souvent regroupés sur une feuille de calcul. Il y a 20 ans, c’était à peu près le seul genre de données auquel les journalistes avaient affaire. Mais nous vivons aujourd’hui dans un monde numérique, un monde dans lequel pratiquement tout peut être (et est de fait) décrit par des chiffres.
Votre expérience professionnelle, 300 000 documents confidentiels, votre cercle d’amis, tout peut être décrit avec simplement deux chiffres : des zéros et des uns. Les photos, les vidéos et les sons sont tous codés avec ces deux mêmes chiffres. Les meurtres, la maladie, les résultats électoraux, la corruption et le mensonge : des uns et des zéros.
Qu’est-ce qui distingue le datajournalisme du journalisme traditionnel ? C’est peut-être les nouvelles possibilités qui s’ouvrent quand on combine un instinct journalistique traditionnel avec l’énorme quantité et diversité d’informations numériques aujourd’hui disponibles.
Et ces possibilités peuvent survenir à chaque étape du processus journalistique : en utilisant par exemple un langage de programmation pour automatiser le processus de collecte et de recoupement d’informations provenant des instances locales, de la police et d’autres sources civiles, comme l’a fait Adrian Holovaty avec « Chicago Crime » puis « EveryBlock ».
Ou en se servant d’un logiciel pour établir des liens entre des centaines de milliers de documents, comme l’a fait The Telegraph avec les notes de frais des députés britanniques 1 .
Le datajournalisme peut permettre de raconter une histoire complexe avec des graphiques clairs. Citons par exemple les discours spectaculaires de Hans Rosling sur la visualisation de la pauvreté mondiale avec Gapminder, visionnés par des millions de personnes à travers le monde. Ou encore le travail de David McCandless (Information is Beautiful , Collins) sur la condensation de gros nombres – la contextualisation des dépenses publiques ou l’analyse de la pollution générée et évitée par l’éruption du volcan islandais –, qui démontre l’importance d’un design clair.
Il peut également aider à expliciter l’impact d’une histoire sur chaque individu, comme le font maintenant régulièrement la BBC et Financial Times avec leurs budgets interactifs (qui permettent de voir comment le budget national vous affecte personnellement ). Et il permet également d’ouvrir le processus de collecte d’informations lui-même, comme le fait si bien The Guardian en partageant des données, des éléments de contexte et des questions sur son Datablog.


Figure 1-1. Enquêtez sur les dépenses de votre député (The Guardian).
Les données peuvent être la source du datajournalisme, elles peuvent être l’outil qui permet de raconter l’histoire – ou elles peuvent être les deux. Comme n’importe quelle source, elles doivent être traitées avec scepticisme ; et comme n’importe quel outil, nous devons prendre conscience de leurs limites et de leur influence sur la forme des histoires qu’elles nous permettent de créer.
Paul Bradshaw, Birmingham City University

Un indicateur du journalisme en mutation
Le datajournalisme, sous bien des aspects, reprend les fondamentaux du journalisme, tout en exprimant certaines dimensions largement inédites d’une activité en train de se réinventer. En premier lieu, il est question d’informer à partir d’un territoire en expansion constante, celui des données. La question de l’accès à celles-ci est loin d’aller de soi, tant elle représente un enjeu majeur touchant la transparence des institutions et de la vie publique.
Dans le datajournalisme s’exprime d’abord le rôle traditionnel du journaliste : identification de ce qui fait sens du point de vue de l’intérêt général, croisement, vérification, puis hiérarchisation des faits. En même temps, cette recherche et cette vérification, et la conception des moyens qui vont permettre de transmettre l’information au public, passent par une coopération étroite avec un professionnel de l’informatique. Cette dimension du datajournalisme qui repose sur les modalités de la coopération avec un développeur, implique un minimum de compétences dans le domaine de l’informatique, donc une formation adéquate, pour le journalisme lui-même. Enfin, dans la construction d’une narration originale, le binôme journaliste-informaticien s’adjoint le plus souvent l’aide de spécialistes du visuel. C’est dire qu’en plus d’être une forme de collecte et de traitement spécifique de l’information, le datajournalisme participe de la recherche et de l’expérimentation d’une écriture multimédia, de modes de narrations inédits.

Le datajournalisme, qui combine dimensions traditionnelles du journalisme s’appliquant au territoire particulier des données, et compétences propres à l’informatique et au traitement graphique, n’est pas forcément L’Avenir du journalisme, mais certainement l’une de ses dimensions. S’exercera-t-il au sein de chaque rédaction ou dans des lieux mutualisés (sur le modèle de l’agence) ? Le laboratoire que constitue le vécu de nombre de rédactions numériques le révélera progressivement.
Jean-Marie Charon, professeur à l’EHESS
Pourquoi les journalistes doivent utiliser des données
Le journalisme est en état de siège. Jusqu’à maintenant, nous comptions sur le fait que nous étions les seuls à détenir la technologie permettant de multiplier et de diffuser les nouvelles de la nuit passée. La presse écrite servait de passerelle. Si quelqu’un voulait toucher tous les habitants d’une ville ou d’une région, il s’en remettait aux journaux. Cette époque est révolue.
Aujourd’hui les nouvelles se diffusent en temps réel, proviennent de multiples sources, blogs et témoins oculaires, et tout ce qui se passe est filtré par un vaste réseau de connexions sociales, noté, commenté – et le plus souvent, ignoré.
C’est ce qui fait toute l’importance du datajournalisme. Il est de plus en plus indispensable de savoir recueillir, filtrer et visualiser les informations invisibles à l’œil nu. Le jus d’orange que vous buvez le matin, le café que vous préparez : dans notre économie mondialisée moderne, il existe des liens invisibles entre ces produits, vous et les autres. Les données sont le langage de ce réseau : de petits morceaux d’information qui bien souvent n’ont aucun intérêt pris séparément, mais sont extrêmement importants quand on les regarde sous le bon angle.
Aujourd’hui déjà, quelques journalistes pionniers démontrent comment ces données peuvent être exploitées pour mieux décrire ce qui se passe autour de nous et comment cela risque de nous affecter.
L’analyse de données peut révéler la « forme d’une histoire » (Sarah Cohen) ou s’apparenter à un « nouvel appareil photo » (David McCandless). En utilisant des données, le journaliste ne s’attache plus à être le premier à publier une information, mais plutôt à être celui qui apporte un éclairage à l’actualité, qui lui donne tout son sens. L’étendue des sujets peut être vaste. La prochaine crise financière qui se prépare. Les taux de marge des produits que nous utilisons. La mauvaise utilisation de fonds publics ou les bévues politiques, présentées sous forme de visualisations de données qui laissent peu de marge de contestation.

Les journalistes doivent saisir l’opportunité que ces données représentent. En utilisant des données, il est possible de transformer une abstraction en quelque chose qui parle à tout le monde. Ils peuvent par exemple expliquer comment une menace abstraite (comme le chômage) affecte les gens en fonction de leur âge, de leur sexe ou de leur niveau d’éducation.
Ils peuvent créer des calculateurs personnalisés pour aider les gens à prendre des décisions, que ce soit acheter une voiture, une maison, choisir une formation ou une orientation professionnelle, ou encore resserrer leur budget pour éviter de s’endetter.
Ils peuvent analyser l’évolution d’une situation complexe, comme une émeute ou un débat politique, démonter les idées reçues et permettre à tout le monde de trouver des solutions potentielles à des problèmes compliqués.
De bonnes connaissances en matière de recherche, de nettoyage et de visualisation de données transforment également le travail de collecte d’informations. Il est reposant de pouvoir construire ses articles à partir d’informations et de faits concrets. Moins de suppositions, moins de citations à rechercher : le journaliste peut élaborer une thèse solide étayée par des données, ce qui peut avoir un impact important sur le journalisme en général. Par ailleurs, l’apprentissage du datajournalisme offre des perspectives d’avenir. Aujourd’hui, alors que les rédactions se réduisent, beaucoup de journalistes espèrent se reconvertir dans les relations publiques. Les datajournalistes et autres spécialistes des données, en revanche, sont déjà très recherchés, et pas seulement dans les médias. Partout dans le monde, des entreprises et des institutions recherchent des « faiseurs de sens », des professionnels sachant exploiter des données et les rendre intelligibles.
Les données apportent une nouvelle promesse, et c’est ce qui enthousiasme tant les salles de rédaction et les pousse à recruter un nouveau type de reporter. Pour les freelances, une bonne maîtrise des données ouvre également la voie à de nouvelles offres et des revenus plus stables. Voyez cela sous cet angle : au lieu d’engager des journalistes pour remplir des pages et des sites web avec du contenu de faible valeur, l’utilisation de données peut créer une demande de packages interactifs, là où il faut une semaine de travail pour répondre à une seule question. C’est un changement bienvenu pour de nombreux médias. Il reste une barrière empêchant les journalistes d’exploiter ce potentiel : ils doivent apprendre à travailler avec des données tout au long du processus – de la question initiale au scoop final.
Travailler avec des données, c’est s’aventurer sur un vaste territoire inconnu. Au premier coup d’œil, les données brutes sont lourdes et indéchiffrables. Il est difficile de leur faire prendre forme. C’est un travail de journaliste expérimenté, qui a la patience et l’endurance nécessaires pour parcourir des données souvent complexes ou ennuyeuses et « voir » les histoires qui s’y cachent.
Mirko Lorenz, Deutsche Welle

Se former : l’enquête
Le Centre européen du journalisme a mené une enquête pour déterminer les besoins des journalistes en matière de formation. Nous avons noté une forte volonté de s’aventurer hors de la zone de confort du journalisme traditionnel et d’investir du temps dans l’acquisition de nouvelles compétences. Les résultats de l’enquête démontrent que les journalistes comprennent le potentiel du datajournalisme, mais qu’ils ont besoin d’un petit coup de pouce pour résoudre les problèmes initiaux qui les empêchent de travailler avec des données. Il est certain que si le datajournalisme continue à se développer, les workflows, les outils et les résultats s’amélioreront rapidement. Des pionniers tels que The Guardian , The New York Times , The Texas Tribune et Die Zeit relèvent sans cesse le niveau. Le datajournalisme restera-t-il l’exclusivité d’une poignée de pionniers, ou est-ce que chaque organisation de presse aura bientôt son équipe de datajournalisme dédiée ? Nous espérons que ce guide aidera de nombreux journalistes et rédactions à tirer parti de cette discipline émergente.

Figure 1-2. Enquête du Centre européen du journalisme sur les besoins en matière de formation
Pourquoi le datajournalisme est-il important ?
Nous avons demandé à quelques-uns des principaux praticiens et des défenseurs du datajournalisme pourquoi ils pensaient que le datajournalisme était un développement important. Voici ce qu’ils avaient à dire.

Filtrer le flux de données
Quand les informations étaient rares, l’essentiel de nos efforts se portait sur la recherche et la collecte. Maintenant qu’elles sont abondantes, le traitement des informations est devenu plus important. Nous traitons les informations à deux niveaux : 1) analyse, pour donner du sens et structurer le flot incessant de données, et 2) présentation, pour faire rentrer les informations importantes et pertinentes dans la tête du consommateur. Comme la science, le datajournalisme dévoile ses méthodes et présente ses découvertes de sorte qu’elles puissent être vérifiées par reproduction.
Philip Meyer, professeur émérite de l’université de Caroline du Nord à Chapel Hill
Nouvelles approches de storytelling
Le datajournalisme est un terme générique qui, dans mon esprit, englobe un ensemble d’outils, de techniques et d’approches de storytelling en constante évolution. Cela peut aller du reportage traditionnel assisté par ordinateur (utilisant des données comme « source ») aux visualisations de données et autres applications plus sophistiquées. L’objectif commun est journalistique : offrir des informations et des analyses pour mieux informer les gens des problèmes importants du moment.
Aron Pilhofer, The New York Times
Du photojournalisme avec un ordinateur portable
Le datajournalisme ne diffère du journalisme traditionnel que dans la mesure où nous utilisons des outils différents. Nous exerçons tous notre métier pour trouver et raconter des histoires. C’est comme le photojournalisme ; il suffit de remplacer l’appareil photo par un ordinateur portable.
Brian Boyer, The Chicago Tribune
Le datajournalisme, c’est le futur
Les journalistes doivent s’y faire : le datajournalisme, c’est le futur. Autrefois, on trouvait des histoires en discutant avec des gens dans un bar, et il se peut que cela vous arrive encore de temps à autre. Mais aujourd’hui, il faut également être capable d’analyser des données, d’en tirer les informations pertinentes et de les replacer dans leur contexte pour aider les gens à en comprendre tous les tenants et les aboutissants.
Tim Berners-Lee, fondateur du World Wide Web

La magie des chiffres rencontre le génie des mots
Le datajournalisme fait le lien entre les statisticiens et les rédacteurs. Être capable d’identifier les tendances et les cas isolés n’est pas seulement important sur le plan statistique, c’est indispensable pour déconstruire le monde complexe dans lequel nous vivons aujourd’hui.
David Anderton, journaliste indépendant
Mettre vos compétences à niveau
Le datajournalisme est un ensemble de nouvelles compétences en matière de recherche, d’analyse et de visualisation de sources numériques, à une époque où les compétences de base du journalisme traditionnel ne suffisent plus. Il ne s’agit pas de remplacer le journalisme traditionnel, mais de le compléter.
À une époque où les sources sont de plus en plus numériques, les journalistes peuvent et doivent s’en rapprocher le plus possible. Internet a ouvert des possibilités qui nous échappent encore. Le datajournalisme n’est que le début de l’évolution de nos pratiques passées qu’il nous faut adapter au monde numérique.
Le datajournalisme remplit deux fonctions principales pour les organisations de presse : trouver des histoires uniques (qui ne sont pas issues de dépêches) et jouer un rôle de veille. Ce sont deux objectifs importants pour les journaux, particulièrement en ces temps de crise financière.
Pour un journal régional, le datajournalisme est primordial. Nous avons un dicton qui dit « un pavé mal fixé devant votre porte importe plus qu’une émeute à l’autre bout du monde ». Le pavé affecte votre vie plus directement. En même temps, la numérisation est partout. Comme les journaux locaux ont un impact direct dans leur quartier et que les sources se numérisent de plus en plus, un journaliste doit être capable de trouver, d’analyser et de visualiser une histoire à partir de données.
Jerry Vermanen, NU.nl
Un remède à l’infobésité
La surabondance d’informations et par conséquent l’incapacité à en traiter un tel volume assez rapidement, est l’un des problèmes les plus importants qui se posent aux gens quand ils doivent prendre des décisions sur la manière de vivre leur vie. Les informations tirées des médias papier et audiovisuels influencent les choix et les actions de nos concitoyens. Bien pratiqué, le datajournalisme aide à combattre la surabondance d’informations.
Tom Fries, fondation Bertelsmann

Une réponse aux relations publiques
La disponibilité des outils de mesure et leur prix en constante diminution – combinés avec une course à la performance et à la rentabilité dans tous les domaines de la société – ont amené des dirigeants à quantifier l’évolution de leurs politiques, à surveiller les tendances et identifier les opportunités.
Les grandes entreprises trouvent toujours de nouvelles statistiques pour prouver que leurs affaires se portent bien. Les politiciens adorent se vanter de réductions du chômage ou d’augmentations du PIB. Le manque d’analyse journalistique autour des affaires Enron, Worldcom, Madoff ou Solyndra prouve que bien des journalistes sont dépassés par les chiffres. Ils les prennent plus souvent pour argent comptant que d’autres faits, car ils dégagent un parfum de sérieux, même lorsqu’ils sont créés de toute pièce.
Une bonne maîtrise des données aidera le journaliste à faire preuve d’esprit critique quand il sera confronté à des chiffres et devrait lui permettre de regagner un peu de terrain dans ses échanges avec les services de RP.
Nicolas Kayser-Bril, Journalism++
Interpréter des informations officielles de manière indépendante
À la suite du tremblement de terre dévastateur et du désastre qui s’en est suivi à la centrale nucléaire de Fukushima en 2011, l’importance du datajournalisme s’est fait ressentir dans les médias japonais, dans un pays globalement en retard en matière de journalisme numérique. Nous ne savions que faire en apprenant que le gouvernement et les experts n’avaient pas de données crédibles sur les dommages. Quand les officiels ont caché les données SPEEDI (diffusion prévue des matériaux radioactifs) au public, nous n’étions pas prêts à les décoder, même si elles avaient fuité. Des volontaires ont commencé à recueillir des données sur la radioactivité avec leurs propres appareils, mais nous n’avions pas les compétences nécessaires en matière de statistique, d’interpolation, de visualisation, etc., pour les utiliser. Les journalistes doivent avoir accès aux données brutes et apprendre à ne pas se fier aux interprétations officielles.
Isao Matsunami, Tokyo Shimbun
Survivre au déluge de données
Les défis et les opportunités présentés par la révolution numérique ne cessent de bouleverser le journalisme. En ces temps d’abondance d’informations, les journalistes comme les citoyens lambda ont besoin d’outils plus performants, que ce soit pour compiler le samizdat du XXI e siècle au Moyen-Orient, traiter un dump de données nocturne ou trouver la meilleure façon de visualiser la qualité de l’eau pour une nation de consommateurs. Pendant que nous essayons de faire face aux défis que représente ce déluge de données, de nouvelles plates-formes de publication permettent également à tout un chacun de recueillir et de partager des données numériquement. Bien que les vecteurs traditionnels de collecte et de diffusion d’informations aient longtemps été les reporters et les rédacteurs, l’information paraît maintenant d’abord sur les réseaux sociaux, grâce aux témoins présents sur place, ou directement sur les comptes officiels des personnes concernées.
D’ailleurs, dans le monde entier, le lien entre données et journalisme se fait de plus en plus étroit. L’importance croissante du datajournalisme repose sur la capacité de ses praticiens à offrir du contexte, de la clarté et – peut-être ce qui est le plus important – à trouver la vérité dans l’immensité du contenu numérique. Cela ne veut pas dire que les conglomérats médiatiques d’aujourd’hui ne jouent pas un rôle crucial, loin de là. Dans cette ère de l’information, les journalistes sont plus indispensables que jamais pour organiser, vérifier, analyser et synthétiser ce torrent de données. Dans ce contexte, le datajournalisme revêt une importance capitale pour la société.
Aujourd’hui, rendre les données intelligibles, particulièrement les gros paquets de données non structurées, est un objectif primordial pour les spécialistes des données du monde entier, qu’ils travaillent dans des salles de rédaction, à Wall Street ou dans la Silicon Valley. Cet objectif devra être appuyé par la création d’outils communs, qu’ils soient employés par des technocrates, des techniciens de santé, ou des développeurs de salle de rédaction.
Alex Howards, O’Reilly Media
Les données régissent notre vie
Il est difficile de bien pratiquer le datajournalisme, car il est difficile de faire du bon journalisme. Il faut déterminer comment obtenir les données, comment les comprendre et comment trouver l’histoire. On tombe parfois sur des impasses et quelquefois il n’y a aucune histoire digne d’intérêt. Après tout, s’il suffisait d’appuyer sur le bon bouton, ce ne serait pas du journalisme. Mais c’est ce qui en fait une discipline utile, et – dans un monde de plus en plus régi par les données – essentielle pour une société libre et juste.
Chris Taggart, OpenCorporates
Un moyen de gagner du temps
Les journalistes n’ont pas de temps à perdre à transcrire des textes à la main ou à extraire des données de fichiers PDF, alors il peut s’avérer extrêmement utile de savoir programmer un peu (ou de savoir à qui s’adresser dans le cas contraire).
Un reporter de Folha de S. Paulo qui travaillait sur le budget de sa ville m’a appelé pour nous remercier d’avoir mis en ligne les comptes de la municipalité de São Paulo (deux jours de travail pour un seul hacker !). Il venait de passer trois mois à les transcrire à la main pour essayer de monter un dossier. Je me rappelle également avoir résolu un « problème de PDF » pour Contas Abertas, une organisation de contrôle parlementaire : 15 minutes et 15 lignes de code pour résoudre l’équivalent d’un mois de travail.
Pedro Markun, Transparência Hacker
Un outil essentiel pour le journaliste
Je crois qu’il est important d’insister sur l’aspect « journalisme » du datajournalisme. L’exercice ne doit pas consister à analyser ou visualiser des données simplement pour le plaisir, mais pour se rapprocher de la vérité. Pour moi, la capacité à analyser et à interpréter des données est un outil essentiel du journaliste moderne plutôt qu’une discipline distincte. En fin de compte, il s’agit de faire un bon travail de journaliste et de raconter des histoires de la façon la plus appropriée.
Le datajournalisme est une autre façon d’étudier le monde et de demander des comptes au pouvoir en place. Avec l’augmentation constante de la quantité de données disponible, il est aujourd’hui plus important que jamais pour les journalistes de se rompre aux techniques du datajournalisme. Tous les journalistes se doivent de maîtriser cet outil, que ce soit en apprenant à travailler directement avec des données ou en collaborant avec quelqu’un qui en est capable. Son vrai pouvoir réside dans sa capacité à aider le journaliste à obtenir des informations qui seraient autrement très difficiles à trouver ou à prouver. Le dossier de Steve Doig analysant la répartition des dégâts causés par l’ouragan Andrew en est un bon exemple. Il a combiné deux bases de données différentes : l’une cartographiant le degré de destruction causé par l’ouragan, l’autre la vitesse des vents. Ce recoupement lui a permis de déterminer les endroits où les réglementations et les mauvaises normes de construction avaient contribué à l’impact du désastre. Il a remporté un prix Pulitzer en 1993 pour cette histoire 2 , qui reste un modèle du genre.
Idéalement, les données doivent vous servir à repérer les aberrations, les informations intéressantes ou surprenantes. En ce sens, elles peuvent servir de piste ou d’indice. Les chiffres peuvent certes être intéressants, mais il ne suffit pas de les rapporter tels quels ; vous devez également expliquer ce qu’ils signifient.
Cynthia O’Murchu, Financial Times
S’adapter aux changements de notre environnement informationnel
Les nouvelles technologies numériques apportent de nouvelles façons de produire et de diffuser le savoir dans nos sociétés. Le datajournalisme peut être considéré comme la tentative de la part des médias de s’adapter et de répondre aux changements de notre environnement informationnel, en employant un storytelling plus interactif et multidimensionnel qui permet aux lecteurs d’explorer les sources sous-jacentes des informations et les incite à participer au processus de création et d’évaluation des histoires.
César Viana, université de Goiás
Un moyen de révéler des choses invisibles
Certaines histoires ne peuvent être comprises et expliquées qu’à travers l’analyse – et parfois la visualisation – de données. Les liens entre des personnes ou des entités influentes passeraient inaperçus, le nombre de morts imputable aux politiques publiques en matière de drogue serait dissimulé, les politiques environnementales qui détruisent nos paysages se poursuivraient sans répit. Mais tout cela évolue grâce aux données que les journalistes obtiennent, analysent et fournissent à leurs lecteurs. Ces données peuvent être aussi simples qu’une feuille de calcul ou un relevé téléphonique, ou aussi complexes que des résultats scolaires ou des statistiques sur les infections nosocomiales, mais elles contiennent toutes des histoires qui valent la peine d’être racontées.
Cheryl Phillips, The Seattle Times
Un moyen de raconter des histoires plus riches
Toute notre vie peut être retracée avec notre empreinte numérique. Ce que nous consommons et lisons sur Internet, nos destinations de voyage et nos préférences musicales, nos premiers amours, les premiers pas de nos enfants, même nos dernières volontés – tout peut-être suivi, numérisé et stocké dans le cloud , puis disséminé à travers le monde. Cet univers de données peut faire ressortir des histoires, apporter des réponses et offrir une compréhension de la vie qui surpasse la reconstruction d’anecdotes la plus rigoureuse.
Sarah Slobin, The Wall Street Journal

Pas besoin de données exclusives pour faire un scoop
Parfois, les données sont déjà publiques et disponibles, mais personne n’a encore pris la peine d’y regarder de près. Dans le cas du rapport de l’Associated Press sur les 4 500 pages de documents déclassifiés décrivant les agissements d’entreprises de sécurité privées au cours de la guerre d’Irak, la matière première a été obtenue par un journaliste indépendant sur plusieurs années, en utilisant le Freedom of Information Act qui oblige le Département d’État américain à divulguer ces documents. L’AP a numérisé les résultats du rapport et les a téléchargés sur DocumentCloud, ce qui nous a permis d’en faire une analyse complète.
Jonathan Stray, The Overview Project

Quelques exemples du genre
Nous avons demandé à quelques-uns de nos contributeurs de citer leur exemple de datajournalisme favori. Les voici.
Do No Harm dans le Las Vegas Sun
Mon exemple préféré est la série « Do No Harm » (« ne pas nuire », précepte de médecine) sur les soins hospitaliers à Las Vegas, réalisée en 2010 par le Las Vegas Sun 3 . En analysant plus de 2,9 millions de factures d’hôpital, le Sun a révélé plus de 3 600 blessures, infections et erreurs chirurgicales évitables. Les journalistes du Sun ont obtenu ces données par le biais de demandes officielles et ont ainsi identifié plus de 300 décès potentiellement évitables. Le dossier contient divers éléments, notamment un graphique interactif permettant au lecteur de voir les hôpitaux commettant plus d’erreurs chirurgicales que la moyenne, une carte avec une frise chronologique indiquant la progression des infections, hôpital par hôpital, et un graphique interactif permettant aux utilisateurs de trier les données par type d’accident ou par hôpital. J’aime ce dossier parce qu’il est facile à comprendre et que l’exploration des données se fait de manière intuitive.

Figure 1-3. Do No Harm (Las Vegas Sun)
Il a également eu un véritable impact : l’assemblée du Nevada y a répondu en votant six nouvelles lois. Les journalistes impliqués ont travaillé très dur pour obtenir et nettoyer les données. L’un d’entre eux, Alex Richards, a renvoyé des données à des hôpitaux et à l’État au moins une douzaine de fois pour faire corriger des erreurs.
Angélica Peralta Ramos, La Nación (Argentina)
Salaires des fonctionnaires gouvernementaux
J’adore le travail que de petites organisations indépendantes font tous les jours, comme ProPublica ou The Texas Tribune , qui emploient l’excellent datajournaliste Ryan Murphy. Si je devais choisir un projet, ce serait la base de données des salaires des fonctionnaires gouvernementaux développée par The Texas Tribune 4 .
Ce projet compile les salaires de 660 000 fonctionnaires gouvernementaux dans une base de données ouverte à tous. Il permet de faire une recherche par agence, nom ou salaire. C’est un outil simple, qui a du sens et rend publiques des informations autrement inaccessibles. Il est facile à utiliser et permet de générer automatiquement des histoires. C’est ce genre de projet qui explique pourquoi The Texas Tribune produit autant de trafic avec ses pages de données.
Simon Rogers, The Guardian

Figure 1-4. Salaires des fonctionnaires gouvernementaux (The Texas Tribune)

Mort aux frontières
Quand j’ai découvert, en 2010, la liste des migrants morts aux frontières de l’Europe 1 , compilée par United – un réseau de 560 ONG européennes – à partir de dépêches de presse et d’organisations internationales ou de défense des droits de l’homme, j’ai vite vu que le PDF était en fait un extrait d’un tableur, et me suis empressé de leur demander le fichier source. Celui-ci contenait bien plus de paramètres que je n’aurais pu en traiter. J’ai donc dû faire des choix, trouver un angle.
J’aurais pu me contenter d’aligner les chiffres, d’écrire qu’on dénombrait plus de 14 000 morts aux frontières de l’Europe (plus de 16 000 aujourd’hui – sans compter ceux qui n’ont pas été recensés), dont 11 000 en Méditerranée, 194 en France et 59 en Libye, que 9 964 étaient morts noyés, 864 de faim ou de soif, et 215 de froid. J’ai préféré permettre aux gens de pouvoir aussi visualiser, sur une carte, le nombre de migrants morts, par pays, par causes de décès, de pouvoir « lire leur histoire » telle que (brièvement) compilée dans la base de données, mais également montrer l’évolution chronologique de cette mortalité, et enfin, et surtout, de permettre potentiellement à plus de gens de lire l’article que j’ai tiré de ces données, et donc de prendre la mesure de cette tragédie. Le Mémorial des morts aux frontières de l’Europe 2 qui en a résulté est probablement le plus dur des articles que j’ai jamais eu l’heur d’écrire. Pas tant parce qu’il m’a fallu attendre plus d’un an avant que je n’obtienne le temps de cerveau disponible d’un développeur – James Lafa – et d’une graphiste – Marion Boucharlat – pour me permettre de le finaliser, ni en raison des galères que cela a pu constituer ou du temps que cela nous a pris (une dizaine de jours), mais à cause de toutes ces histoires que je me suis donc retrouvé à lire, et qui font partie des plus terribles qu’il m’ait été donné de raconter.
Jean-Marc Manach

Copyleft Owni.fr, carte réalisée par Jean-Marc Manech, Marion Boucharlat et James Lafa.
1 : http://www.unitedagainstracism.org/pages/underframeFatalRealitiesFortressEurope.htm
2 : http://owni.fr/2011/02/18/app-la-carte-des-morts-aux-frontieres-de-leurope/

Message Machine
J’adore le dossier « Message Machine » et le billet s’y rapportant sur le « nerd blog » de ProPublica 5 . Tout a commencé quand des « tweetos » se sont étonnés d’avoir reçu des emails différents de la campagne Obama. ProPublica l’a remarqué et a demandé à ses lecteurs de faire suivre tous les emails de la campagne qu’ils avaient reçus. La présentation est élégante et compare visuellement les différents emails qui ont été envoyés ce soir là. C’est génial, tout d’abord parce qu’ils ont recueilli leurs propres données (un faible échantillon, certes, mais suffisant pour raconter l’histoire). Mais ce qui est doublement génial, c’est qu’ils racontent l’histoire d’un phénomène en pleine émergence : l’utilisation de données ciblées dans une campagne politique. Un avant-goût de ce qui nous attend.
Brian Boyer, The Chicago Tribune

Figure 1-7. Message Machine (ProPublica)
Chartball
L’un de mes projets de datajournalisme favoris est l’œuvre d’Andrew Garcia Phillips, « Chartball » 6 . Andrew est un grand amateur de sport avec une soif inextinguible de données, une vision incroyable en matière de design et un vrai talent de programmeur. Avec Chartball, il visualise non seulement l’ensemble de l’histoire, mais il détaille aussi les réussites et les échecs de chaque joueur et équipe. Il offre du contexte, des graphiques attrayants, et son travail est profond, divertissant et intéressant – et pourtant, je ne suis pas fan de sport !
Sarah Slobin, The Wall Street Journal

Figure 1-6. Graphique des victoires et des défaites (Chartball)
Le datajournalisme en perspective
En août 2010, des collègues du Centre européen du journalisme et moi-même avons organisé à Amsterdam ce qui fut selon nous l’une des premières conférences internationales sur le datajournalisme. À cette époque, pas grand monde ne parlait du sujet et il n’existait qu’une poignée d’organisations connues pour leur travail dans ce domaine.
La manière dont certaines organisations médiatiques comme The Guardian ou The New York Times ont géré l’énorme quantité de données publiées par Wikileaks a largement contribué à démocratiser le terme datajournalisme, qui est alors rentré dans l’usage (avec « journalisme assisté par ordinateur ») pour décrire l’utilisation de données dans le but d’améliorer la couverture journalistique et d’enquêter en profondeur sur un sujet donné. En parlant à des datajournalistes et à des journalistes expérimentés sur Twitter, il semblerait que l’une des toutes premières formulations de ce que nous appelons maintenant datajournalisme ait été produite en 2006 par Adrian Holovaty, créateur d’EveryBlock, un service d’information permettant aux utilisateurs de savoir ce qui se passe dans leur quartier, leur « pâté de maisons ». Dans son court essai intitulé Un changement fondamental à apporter aux sites d’information , il enjoint les journalistes à publier des données structurées et lisibles par des machines pour accompagner le traditionnel « gros pavé de texte » :
Par exemple, supposons qu’un journal ait écrit un article sur un incendie local. Je peux lire cet article sur mon téléphone portable, hourra, vive la technologie ! Mais ce que je veux vraiment pouvoir faire, c’est explorer les faits bruts de cette histoire un par un, avec des couches d’attribution et une infrastructure permettant de comparer les détails de l’incendie avec ceux d’incendies précédents : date, heure, lieu, victimes, numéro de la caserne de pompiers, distance de la caserne, nom et nombre d’années d’expérience de chaque pompier présent sur les lieux, temps mis par les pompiers pour arriver sur place, et les incendies ultérieurs, le cas échéant.
Mais quelle est la différence avec d’autres formes de journalisme qui se servent de bases de données ou d’ordinateurs ? Comment, et dans quelle mesure le datajournalisme est-il différent d’autres formes de journalisme du passé ?
Journalisme assisté par ordinateur et journalisme de précision
Cela fait un certain temps que l’on utilise des données pour améliorer les reportages et fournir des informations structurées (si ce n’est interprétables par des machines) au public. La discipline qui se rapproche peut-être le plus directement de ce que nous appelons aujourd’hui datajournalisme est le journalisme assisté par ordinateur, ou JAO, qui fut la première approche organisée et systématique employant des ordinateurs pour recueillir et analyser des données dans le but d’améliorer l’information.
Le JAO fut utilisé pour la première fois en 1952 par CBS pour prédire les résultats de l’élection présidentielle américaine. Depuis les années 1960, des journalistes (principalement des journalistes d’investigation américains) ont cherché à assurer un contrôle indépendant du pouvoir en analysant des bases de données publiques à l’aide de méthodes scientifiques. Les promoteurs de ces techniques assistées par ordinateur, également connues sous le nom de « journalisme de service public », se sont attachés à rapporter les tendances, défaire les mythes populaires et révéler les injustices perpétrées par les autorités publiques et les entreprises privées. Par exemple, Philip Meyer a cherché à démystifier la lecture officielle des émeutes de 1967 à Detroit en démontrant que les manifestants n’étaient pas uniquement des migrants du sud faiblement éduqués. Dans les années 1980, le dossier « The Color of Money » de Bill Dedman a révélé une discrimination raciale systémique en matière de crédit dans les plus grandes institutions financières. Dans son article « What Went Wrong », Steve Doig a cherché à analyser l’étendue des dégâts provoqués par l’ouragan Andrew au début des années 1990 pour comprendre l’impact des mauvaises pratiques et politiques en matière de développement urbain. Le journalisme axé sur des données s’est avéré être un service public précieux et a rapporté des prix prestigieux à ses pratiquants.
Au début des années 1970, l’expression « journalisme de précision » a été inventée pour décrire cette méthode de collecte d’informations : « l’application de méthodes de recherche issues des sciences sociales et comportementales à la pratique du journalisme » (extrait du livre The New Precision Journalism , de Philip Meyer Indiana Univ Pr 7 ). Le journalisme de précision était perçu comme étant pratiqué dans les institutions médiatiques dominantes par des professionnels formés au journalisme et aux sciences sociales. Il est né en réponse au « nouveau journalisme », une forme de journalisme qui appliquait des techniques de fiction au reportage. Meyer suggère que les techniques scientifiques de collecte et d’analyse de données sont préférables aux techniques littéraires pour aider le journalisme dans sa quête d’objectivité et de vérité.
Le journalisme de précision peut être vu comme une réaction aux insuffisances et aux faiblesses souvent prêtées au journalisme : dépendance aux communiqués de presse (plus tard qualifié de « churnalism », ou journalisme prémâché), influence des sources d’autorité, etc. D’après Meyer, ces problèmes résultent d’un manque d’application de techniques des sciences de l’information et de données scientifiques telles que les sondages et les archives publiques. Le journalisme de précision, tel qu’il était pratiqué dans les années 1960, servait à représenter des groupes marginaux. D’après Meyer :
Le journalisme de précision était une façon d’élargir la boîte à outils du reporter pour lui permettre de couvrir des sujets auparavant inaccessibles, du moins dans leur forme brute. Il était particulièrement utile pour donner une voix aux minorités et aux groupes dissidents qui luttaient pour leur représentation.
Dans les années 1980, un article majeur portant sur la relation entre le journalisme et les sciences sociales fait écho au discours actuel sur le datajournalisme. Les auteurs, deux professeurs de journalisme américains, suggèrent qu’au cours des années 1970 et 1980, la conception publique de l’information a évolué d’une notion plus restreinte de journalisme « factuel » vers un journalisme « situationnel ». Par exemple, en utilisant des données de recensement ou des sondages, les journalistes peuvent « dépasser le spectre d’évènements spécifiques et isolés afin de fournir un contexte qui leur donne un sens ».
Comme on peut l’imaginer, l’utilisation de données dans le but d’améliorer les reportages remonte aussi loin que les données existent. Comme le fait remarquer Simon Rogers, le premier exemple de datajournalisme au Guardian date de 1821. Il s’agit d’un listing « volé » dévoilant le nombre d’élèves et le coût de la scolarité dans chaque école de Manchester. D’après Rogers, il avait permis de déterminer le nombre véritable d’étudiants recevant une éducation gratuite, qui était sensiblement plus élevé que le nombre officiel. Parmi les premiers exemples de datajournalisme en Europe, on peut également citer Florence Nightingale et son fameux rapport intitulé « Mortality of the British Army », publié en 1858. Dans son rapport au Parlement, elle avait utilisé des graphiques pour plaider pour une amélioration des services de santé dans l’armée britannique. Le plus célèbre est sa « crête de coq », un diagramme circulaire en douze sections représentant chacune un nombre de morts par mois, qui mettait en évidence le fait que l’immense majorité des morts était imputable à des maladies évitables plutôt qu’à des balles ennemies.

Figure 1-7. Datajournalisme dans The Guardian en 1821 (The Guardian)

Figure 1-8. Mortalité de l’armée britannique par Florence Nightingale (image de Wikipédia)

Datajournalisme et journalisme assisté par ordinateur
À l’heure actuelle, il y a un débat sur l’évolution du terme « datajournalisme » et son lien avec de précédentes pratiques journalistiques employant des techniques informatiques pour analyser des bases de données.
Certains prétendent qu’il y a une différence entre le JAO et le datajournalisme. Selon eux, le JAO est une technique de collecte et d’analyse de données tendant à améliorer les reportages (généralement d’investigation), alors que le datajournalisme emploie des données dans tout le workflow journalistique. En ce sens, le datajournaliste prête autant – et parfois plus – d’attention aux données elles-mêmes, plutôt que de simplement les utiliser pour trouver ou enrichir des histoires. C’est ainsi que l’on voit The Guardian Datablog ou The Texas Tribune publier des bases de données accompagnant leurs articles – voire des bases de données seules – pour que tout le monde puisse les explorer et les analyser.
Une autre différence, c’est qu’auparavant, les journalistes d’investigation souffraient du manque d’informations sur les sujets qu’ils voulaient traiter. Bien sûr, ce problème se pose toujours aujourd’hui, mais il y a également une surabondance d’informations dont les journalistes ne savent pas forcément que faire. Comme exemple récent, on pourrait citer le Combined Online Information System (COINS), la plus grosse base de données anglaise sur les dépenses publiques. Cette base de données était réclamée depuis longtemps par les organisations militant pour la transparence des comptes publics, mais elle a laissé de nombreux journalistes perplexes lors de sa publication.
D’un autre côté, certains disent qu’il y a aucune différence de taille entre le datajournalisme et le journalisme assisté par ordinateur. Il est maintenant couramment admis que même les pratiques médiatiques les plus récentes ont à la fois un héritage historique et un certain degré de nouveauté. Plutôt que de chercher à savoir si le datajournalisme est une discipline complètement nouvelle ou non, il serait peut-être plus profitable de le considérer comme relevant d’une longue tradition, mais répondant à des circonstances et à des conditions nouvelles. Même s’il n’y a pas forcément de différence en termes d’objectifs et de techniques, l’émergence de l’étiquette « datajournalisme » au début de notre siècle dénote une nouvelle phase dans laquelle l’énorme volume de données en libre accès sur Internet – combiné avec des outils sophistiqués axés sur l’utilisateur, l’autopublication et le crowdsourcing – permet à de plus en plus de gens de travailler avec des données, plus facilement que jamais.
Le datajournalisme, c’est la démocratisation des données
Les technologies numériques et le Web sont en train de changer fondamentalement notre manière de publier des informations. Le datajournalisme n’est qu’une partie de l’écosystème d’outils et de pratiques qui s’est développé autour des sites et des services de données. La nature même de la structure en hyperliens du Web consiste à citer et partager les sources, et c’est ainsi que nous avons l’habitude de parcourir les informations aujourd’hui. Si l’on remonte encore plus loin, le principe fondateur de la structure du Web est issu du principe de citation utilisé dans les travaux universitaires. La citation et le partage des matériaux sources et des données de l’histoire est l’une des avancées principales du datajournalisme, ce que le fondateur de WikiLeaks Julian Assange qualifie de « journalisme scientifique ».
En permettant à tout-un-chacun de parcourir les sources des données et de trouver les informations qui l’intéressent, mais aussi de vérifier des assertions et de remettre en question des idées reçues, le datajournalisme représente de fait une démocratisation de masse des ressources, outils, techniques et méthodologies auparavant utilisés par des spécialistes, des journalistes d’investigation, des chercheurs en sciences sociales, des statisticiens, des analystes et autres experts. Si, aujourd’hui, la pratique consistant à citer et à donner le lien de ses sources de données est spécifique au datajournalisme, nous vivons dans un monde où les données sont intégrées de façon de plus en plus transparente au tissu des médias. Les datajournalistes ont un rôle important à jouer dans la démocratisation des données auprès du plus grand nombre.
Pour l’instant, la communauté naissante de personnes se réclamant du datajournalisme est distincte de la communauté du JAO, qui est plus mûre. Gageons qu’à l’avenir, nous verrons des liens plus étroits s’établir entre ces deux communautés, de la même façon que nous voyons de nouvelles ONG et des organisations médiatiques citoyennes comme ProPublica et le Bureau of Investigative Journalism travailler main dans la main avec des médias traditionnels pour enquêter sur certains sujets. La communauté du datajournalisme développe peut-être des approches plus innovantes dans sa manière de fournir des données et de présenter des histoires, mais l’approche profondément analytique et critique de la communauté du JAO a certainement des choses à lui apprendre.
Liliana Bounegru, Centre européen du journalisme
__________
1 : http://tgr.ph/mps-expenses .
2 : http://www.pulitzer.org/awards/1993
3 : http://www.lasvegassun.com/hospital-care/
4 : http://bit.ly/texastrib-employee
5 : http://bit.ly/nerd-blog-post
6 : http://www.chartball.com/
7 : http://bit.ly/precision-journalism
Chapitre 2
Dans la salle de rédaction
Quel rôle joue le datajournalisme dans les rédactions du monde entier ? Comment les pionniers du datajournalisme ont-ils su convaincre leurs collègues de publier des bases de données complètes ou de créer des applications d’information basées sur ces données ? Les journalistes doivent-ils apprendre à programmer ou travailler en tandem avec des développeurs talentueux ? Dans cette section, nous étudierons le rôle des données et du datajournalisme à la BBC, au Chicago Tribune, au Guardian, au Texas Tribune, à Rue89 et au Zeit Online. Nous apprendrons comment repérer et recruter de bons développeurs, impliquer des gens par le biais de hackatons et d’autres évènements, collaborer au-delà des frontières, et nous verrons quels modèles économiques sont envisageables pour le datajournalisme .


Datajournalisme à la BBC
Le terme « datajournalisme » peut recouvrir de nombreuses disciplines et son sens peut varier selon les organisations. Il semble donc utile de définir ce que nous entendons par « datajournalisme » à la BBC. Globalement, ce terme englobe les projets qui utilisent des données pour :
• permettre au lecteur de trouver des informations qui le concernent personnellement ;
• révéler une histoire remarquable jusqu’alors passée inaperçue ;
• aider le lecteur à mieux comprendre un problème complexe.
Ces catégories peuvent se chevaucher et, dans un environnement numérique, s’accompagnent souvent de visualisations.
Donner une dimension personnelle
Sur le site web BBC News, nous utilisons des données pour offrir des services et des outils à nos utilisateurs depuis plus de dix ans.
L’exemple le plus conséquent, que nous avons publié pour la première fois en 1999, est notre classement des établissements scolaires, qui exploite les données publiées chaque année par le gouvernement. Les lecteurs peuvent chercher des écoles par code postal et les comparer selon un certain nombre de critères. Des journalistes spécialistes de l’éducation travaillent également avec l’équipe de développement pour dénicher des histoires intéressantes avant que les données ne soient publiées.
Quand nous nous sommes attaqués à ce projet, il n’existait pas de site officiel permettant au public d’explorer les données. Mais maintenant que le Department for Education offre un service comparable, nous nous intéressons plutôt aux histoires qui émergent de ces données.
Le défi dans ce domaine consiste à offrir un accès aux données qui présentent un réel intérêt pour le public. Par exemple, nous avons récemment réalisé un projet intitulé « Every death on every road » (« Chaque mort sur chaque route ») dans lequel nous dévoilions une vaste base de données normalement inaccessible au public. En offrant une fonction de recherche par code postal, nous permettions aux utilisateurs de déterminer l’emplacement de tous les accidents de la route mortels survenus au cours de la décennie écoulée au Royaume-Uni.
Nous avons créé des visualisations pour certains des faits et des chiffres marquants qui ressortaient des données de la police, et pour donner au projet un aspect plus dynamique et humain, nous avons fait équipe avec la London Ambulance Association ainsi que la radio et chaîne de TV BBC London afin de suivre les accidents en direct dans la capitale. Ils étaient signalés, en direct également, sur le site ainsi que sur Twitter avec le hashtag #crash24, et les collisions étaient cartographiées en temps réel.

Des outils simples
Tout en offrant la possibilité d’explorer de grosses bases de données, nous avons rencontré un certain succès en créant des outils simples permettant aux utilisateurs de trouver des informations qui les concernent personnellement. Ces outils plaisent aux gens qui n’ont pas forcément le temps de lire une analyse détaillée. La possibilité de partager un fait qui concerne la vie personnelle des gens est quelque chose que nous avons commencé à intégrer comme étant normal.
Un exemple un peu trivial de cette approche est notre article « The world at 7 billion : What’s your number ? » (« Sept milliards dans le monde : quel est votre numéro ? »), publié pour coïncider avec la date officielle à laquelle la population mondiale devait dépasser les sept milliards d’individus. En entrant sa date de naissance, l’utilisateur obtenait son « numéro » et pouvait le partager via Twitter ou Facebook. L’application utilisait des données fournies par le Fonds des Nations unies pour la population. Elle a remporté un vif succès, au point de devenir le lien le plus partagé sur Facebook en 2011 au Royaume-Uni.

Figure 2-1. Sept milliards dans le monde (BBC)
Comme autre exemple récent, on peut citer le calculateur de budget de la BBC, qui permettait aux utilisateurs de calculer combien d’argent ils perdraient ou gagneraient lors de l’entrée en vigueur du budget annuel – puis de partager ce chiffre. Nous nous sommes associés au cabinet d’expertise comptable KPMG LLP, qui nous a fourni des calculs basés sur le budget annuel, puis nous avons travaillé d’arrache-pied pour concevoir une interface attrayante qui encouragerait les utilisateurs à utiliser le calculateur.

Analyser les données
Mais où est le journalisme là-dedans ? Trouver les histoires qui se cachent dans les données est une définition plus traditionnelle du datajournalisme. Y a-t-il un scoop enterré dans la base de données ? Tous les chiffres sont-ils corrects ? Est-ce qu’ils prouvent ou réfutent une théorie ? Ce sont autant de questions qu’un datajournaliste doit se poser. Mais on peut perdre beaucoup de temps à tamiser une énorme base de données en espérant trouver quelque chose de remarquable.
Dans ce domaine, nous avons constaté qu’il était plus productif de s’associer avec des équipes ou des programmes d’investigation ayant l’expertise et le temps nécessaires pour enquêter. Le programme d’affaires publiques Panorama de la BBC a passé des mois à travailler avec le Centre for Investigative Journalism afin de recueillir des données sur les salaires du secteur public. Cette collaboration a produit un documentaire TV et un rapport spécial en ligne, « Public sector pay : the numbers » (« Salaires du secteur public : les chiffres »), dans lequel toutes les données étaient publiées et visualisées avec une analyse secteur par secteur.
En plus de savoir s’associer à des journalistes d’investigation, il est essentiel d’être en contact avec des journalistes spécialisés. Quand un collègue spécialiste en économie a analysé des données sur les coupes budgétaires prévues par le gouvernement, il en a conclu que celui-ci exagérait la portée de ces mesures. Cela a donné un dossier exclusif, « Making sense of the data » (« Comprendre les données »), accompagné d’une visualisation claire, qui a remporté un prix de la Royal Statistical Society.
Comprendre un problème
Mais le datajournalisme ne consiste pas nécessairement à repérer des exclusivités. Le rôle de l’équipe de visualisation de données est de combiner un bon design avec une narration éditoriale claire pour offrir une expérience prenante à l’utilisateur. Une visualisation attrayante utilisant les bonnes données peut permettre de mieux comprendre un problème ou une histoire, et nous utilisons souvent cette approche dans notre storytelling à la BBC. Une technique utilisée dans notre décompte des demandeurs d’emploi au Royaume-Uni consiste à présenter l’évolution chronologique des données sur une carte pour donner une vision claire des changements 1 .
La visualisation « Eurozone debt web » (« Toile de la dette de l’Eurozone ») explore le complexe enchevêtrement des prêts entre pays. Elle explique un problème compliqué de manière visuelle, à l’aide de couleurs et de flèches proportionnelles aux montants en jeu et d’un texte clair.

  • Accueil Accueil
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • BD BD
  • Documents Documents