Dirty Data, Clean Truth: Journalism’s Hidden Struggle

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Dirty Data, Clean Truth: Journalism’s Hidden Struggle

Écouter gratuitement

Voir les détails du balado

À propos de cet audio

Behind every gripping data-driven headline is a journalist elbow-deep in messy, inconsistent, sometimes maddening data. In this episode, we explore the unsung labor of data preparation in journalism — and how it compares to the workflows of data scientists.

Based on a recent study, we uncover how journalists tackle dirty data from fragmented sources, PDFs from FOIA requests, and tables that change over time like shapeshifting monsters. From regionally inconsistent COVID stats to detective-level entity matching, this is the side of data journalism the public rarely sees — but desperately needs to understand.

🎙️ Topics include:

What “dirty data” really means in journalism
The 4 integration nightmare archetypes
Why journalists can’t just impute missing values
A fresh way to categorize data quality issues
The tension between storytelling and spreadsheet chaos

If you’ve ever cursed a CSV or tried to make sense of government data, this one’s for you.

🎧 Hosted by Sébastien Deschamps

Pas encore de commentaire

DÉBUTER

EXPLORER LES CATÉGORIES

Dirty Data, Clean Truth: Journalism’s Hidden Struggle

Échec de l'ajout au panier.

Échec de l'ajout à la liste d'envies.

Échec de la suppression de la liste d’envies.

Échec du suivi du balado

Ne plus suivre le balado a échoué

Dirty Data, Clean Truth: Journalism’s Hidden Struggle

À propos de cet audio