Как обычно, коллектив Мать Джонс округляет герои и монстры прошлого года. Найдите героев и монстров 2021 года здесь.
Этот монстр всегда поднимает свою уродливую голову, когда я думаю, что получаю то, что хочу: общедоступный набор данных, который может пролить свет на несправедливость или ужас в мире. Поначалу это выглядит заманчиво. Обычно это правительственная база данных, представленная в настоящем тематическом парке графиков и помеченных цифр. Но прячется прямо под кнопкой загрузки, он молчит. Возможность загрузки необработанных данных недоступна.
Хотите знать, сколько иммигрантов таможенники и пограничники США встречают на юго-западной сухопутной границе? Есть визуализация для этого. Хотите проверить их математику? Очень плохо. Но реальность этой игры более коварна. Речь идет о предоставлении доступа, достаточного для исключения.
CBP — этот замечательный образец хорошего управления недавно поймали журналистов-расследователей— вероятно, будет утверждать, что это прозрачно, поскольку данные публикуются как есть. Более того, агентство могло бы заявить, что, визуализируя и агрегируя информацию, оно делает базовые данные более доступными для тех, кто не знает, как или не хочет тратить время на анализ самих данных. Тем не менее, ни то, ни другое не должно препятствовать тому, чтобы основные цифры были доступны тем, кто хочет погрузиться глубже.
Репортеры, умеющие анализировать большие массивы данных, постоянно используют правительственные данные с поразительным эффектом. ProPublica показал где воздух, вызывающий рак, находится в худшем состоянии.(Непропорционально сильно пострадали места, где преимущественно проживают цветные люди.) Разметка показали, каковы цветные люди гораздо больше шансов, что их заявка на ипотеку будет отклонена, и Лос-Анджелес Таймс показал, как Заместители шерифа Лос-Анджелеса обыскивают велосипедистов на мелких остановках. (В семи из каждых 10 остановок участвует латиноамериканский велосипедист.) Ни одно из этих расследований не было бы возможным, если бы правительственные чиновники решали, как репортеры анализировали данные и какие точки данных были включены.
Привратники иногда утверждают, что эти блестящие барьеры защищают конфиденциальность людей, которые находятся в базе данных, и защищают данные от аналитиков, которые их не понимают и могут сделать неверные выводы.
Вероятно, есть некоторые базы данных, которые настолько личные, что их публичный выпуск не следует разглашать. Но в подавляющем большинстве случаев эти утверждения делают больше для защиты от несправедливости, окутывая действия правительства туманом. Будет ли иммигрант, ищущий новую жизнь в Соединенных Штатах, заботиться о том, чтобы больше информации об их взаимодействии с пограничным патрулем было обнародовано? Вероятно, нет — тем более, что имена и другой личный материал можно легко удалить перед публикацией набора данных. Мог ли репортер сделать ошибку? Конечно. Но вполне возможно, что правительство ошибается, случайно или иным образом, в своем собственном представлении данных.
В конечном счете, во времена неопределенности и скептицизма анализ данных может обеспечить основу для понимания и, что, возможно, даже более важно, проверки. Когда Мать Джонс нашла данные бухгалтерского учета, показывающие, как Purdue Pharma потратила 115 миллионов долларов на финансирование других организаций— включая группы, которые помогли распространить его опиоидные сообщения, — мы преобразовали его в удобную базу данных. Но мы также выпустили исходный PDF-файл и окончательная электронная таблица, просто как и многие другие новостные организации. Любой желающий может проверить оба документа, чтобы убедиться в их правильности. Все, что я хочу, — это сделать то же самое с набором данных CBP и другими подобными. Вместо этого вся история скрывается за визуализациями и агрегацией. Это иллюзия прозрачности, используемая как дубинка против настоящего.
источник: www.motherjones.com