8 do’s en don’ts van Jennifer LaFleur en David Donald

Het datajournalistieke wiel is al uitgevonden.

Ik was bij de VVOJ conferentie 2012 – 16 en 17 november in Antwerpen. Met dit jaar speciale aandacht voor datajournalistiek en datavisualisatie, inclusief een datajournalistiek trainingsdag op 15 november. Lees hier alle blogposts over de conferentie.

Bij de workshop ‘Working with data 2’ presenteerden Jennifer LaFleur van Propublica en David Donald van The Center for Public Integrity hun datajournalistieke do’s en dont’s.

    1. Het wiel is al uitgevonden

      Leen tools voor data-analyse uit de sociale wetenschappen. In vakgebieden ondermeer de politicologie, economie en sociologie wordt al veel langer met statistiek en data-analyse gewerkt. Vaak kunnen wetenschappers je daar veel meer over vertellen. Maar let op, stay tuned: leen niet de taal van sociale wetenschappers. ;)

  1. Praat met experts

    Vraag wetenschappers bij kans de hemd van het lijf. En dan niet alleen over de methoden die zij gebruiken voor het analyseren van data. Vraag ze bijvoorbeeld wanneer ze jouw artikel geloofwaardig vinden. ‘Geloof je mijn verhaal als ik de data via stap x, y en z analyseer?’ Met een relatief kleine moeite helpen ze je zo aan een betrouwbare methode voor je analyse – die je vervolgens zelf kunt gaan toepassen.

  2. Analyse is belangrijk

    Natuurlijk wil je dat jouw datavisualisatie er mooi uitziet; maar eerst moet je data-analyse goed zijn. Liever iets lelijks dat klopt, dan mooie graphic die bol staat van de fouten. Of zoals David Donald zei:

    Go beyond the ‘this is really neat’-fase.

  3. Kopieer je resultaten

    Voor je een verhaal op basis van data publiceert zal je de uitkomst moeten controleren; een foutje is zo gemaakt. En als je later terug moet komen op je resultaten omdat ze niet klopten, gelooft een volgende keer niemand je meer. David Donald zegt zijn analyses daarom altijd meerdere keren uit te voeren. Het resultaat van die analyses moet drie keer op een rij hetzelfde zijn; anders klopt er iets niet. En als er ook maar het vermoeden bestaat dat iets niet klopt, wordt het niet gepubliceerd.

  4. Eerst zeker weten, dan delen

    Als je ergens niet zeker van bent, zal je dat nog niet publiceren. (Toch?) Veel vaker gaan datajournalisten de fout in door hun vermoedens te delen met collega’s. Niet handig, want die collega’s rekenen op jouw kunde en nemen graag aan dat het waar is. Jennifer LaFleur:

    If you tell your colleagues that you think you found something, they will believe it’s true.

    Pijnlijk als je later aan je collega’s moet toegeven dat je je hebt vergist.

  5. Taalgebruik: statistisch vs. journalistiek

    Let op je taal in combinatie met statistiek. Statistisch gezien hoeft een toename niet ‘significant’ te zijn, terwijl dat journalistiek gezien dan wel het geval is. Denk aan een toename van het aantal verkeersdoden in een kleine stad van 35 naar 40 per jaar. Statistisch gezien geen schokkende toename, maar het zijn wel 5 extra doden ten op zichte van het jaar daarvoor.

  6. Publiceer je methode

    Nee, je wilt je lezers niet lastig vallen met de precieze aanpak van je steekproef; de draaitabel die je gebruikte; of de datasets die je in Access combineerde. Verreweg het grootste deel van het publiek heeft alleen interesse in het journalistieke verhaal waar je data-analyse in resulteerde. Toch kan het nuttig zijn om je methode te beschrijven in bijvoorbeeld een whitepaper. Bijvoorbeeld voor de wetenschappers die je hebben geholpen; voor je eigen archief en dat van collega’s; of voor de paar nerds die het wel willen weten. Zo publiceerde Jennifer LaFleur een whitepaper – ‘How ProPublica Analyzed Pardon Data‘ – over haar werkwijze voor het verhaal ‘Presidential Pardons heavily in favor of whites‘.

  7. Gebruik je verstand

    Als iets te mooi klinkt om waar te zijn, dan is dat vaak ook zo. Misschien is er voor de uitspraak ‘in een gebied met meer ooievaars, krijgen vrouwen meer kinderen’ wel statistisch bewijs te vinden. Toch zegt je boerenverstand dat het toeval is; het verband door andere factoren veroorzaakt wordt; en/of dat het niet de juiste correlatie is. Er is een reden waarom je met je boerenverstand zo ver kunt komen.

Filed under Geen categorie