Наукообразная чушь. Разоблачение мошенничества, предвзятости, недобросовестности и хайпа в науке - Стюарт Ричи
Финал истории с методикой STAP чудовищно печальный. Биолог Ёсики Сасаи, блестящий специалист по стволовым клеткам и соавтор в тех статьях, не замешанный в мошенничестве, но, согласно отчету RIKEN, несущий “тяжкую ответственность” за то, что не перепроверял результаты Обокаты, покончил с собой, повесившись в здании института в августе 2014-го[195]. Ему было пятьдесят два года. В своей предсмертной записке он упомянул негодование в средствах массовой информации, которое поднялось после раскрытия обмана Обокаты[196].
Истории Хвана и Обокаты обе явно необычны в одном отношении: мошеннические статьи снискали невероятную известность. Это были публикации в Science и в Nature, двух ведущих журналах мира. Довольно тревожно уже то, что две столь заметных пустышки сумели пройти процесс отбора в таких журналах, но еще престижность этих изданий означала, что статьи немедленно привлекут внимание всего мира – и внимание пристальное. Если такого рода мошенничество происходит на самом высоком научном уровне, получается, что куда больше фальсификаций остаются незамеченными, выходя в свет в менее известных журналах. Что ставит перед нами вопрос: как часто биологи подделывают изображения в своих статьях? В 2016 году микробиолог Элизабет Бик и ее коллеги решили это выяснить.
Рис. 1. Вестерн-блот с дублированием, найденный Бик и ее коллегами. Последние две полоски (дорожки 9 и 10) идентичны, изображение было задублировано (и то, что справа, слегка растянуто), вероятно, в программе вроде Photoshop. Та статья позднее была исправлена. Изображение взято из Bik E. M. et al., 2016
В сорока журналах по биологии они искали публикации, содержащие результаты вестерн-блоттинга, всего была отобрана двадцать тысяч шестьсот двадцать одна статья[197]. Поистине героически Бик лично просмотрела каждую публикацию, ища на фотоизображениях неправомерное дублирование. Она нашла достаточно, чтобы существенно пополнить галерею недобросовестных научных изображений: там было не только бесхитростное дублирование (см., к примеру, рисунок 1 на следующей странице), но и кадрирование в стиле Хвана, склеивание и подгон под нужные размеры в духе Обокаты и еще целый веер других нечестных приемов. В целом 3,8 % опубликованных статей (примерно одна из двадцати пяти) содержали сомнительное изображение. При последующем анализе публикаций из одного только журнала по клеточной биологии Бик с коллегами обнаружила еще большую долю – 6,1 %[198]. Во многих из этих статей просто содержались честные ошибки, и авторы могли решить проблему, опубликовав соответствующие поправки. Однако примерно 10 % тех статей были отозваны, а значит, в них содержалось что-то погнуснее. Если считать эти числа репрезентативными для статей по клеточной биологии вообще, то, по расчетам Бик, до тридцати пяти тысяч публикаций в научной литературе должны быть отозваны. Были и хоть какие-то хорошие новости: похоже, более престижные журналы в среднем реже публикуют статьи с дублированными рисунками. Пожалуй, самыми интригующими оказались результаты по рецидивистам: когда Бик и ее команда обнаруживали статью с поддельными рисунками, они проверяли, нет ли дублирования и в других публикациях того же автора. Оказывалось, что есть, без малого в 40 % случаев. Дублирование одного рисунка еще можно расценить как небрежность, дублирование двух выглядит мошенничеством.
Пока мы в основном говорили о жульничестве с изображениями, но мошенничают в науке далеко не только с ними. Вероятно, успешнее можно совершить – и спрятать – мошенничество с числами: строками и столбцами чисел, составляющих набор данных исследования. В предисловии мы познакомились с Дидериком Стапелом, который попросту вбивал нужные ему значения в таблицы и выдавал за реальные результаты. Как часто происходит подобное жульничество с данными? И насколько легко его вычислить?
По счастью, точно так же как необыкновенно сложно убедительно подделать Рембрандта или Вермеера (или убедительно сфабриковать фотографию вестерн-блота), столь же трудно фальсифицировать набор данных, не оставив улик. Данные, взятые с потолка, не обладают теми свойствами, каких мы ожидаем от данных, полученных в реальном мире[199]. По большому счету так происходит оттого, что никакая наука не может быть строго-строго точной: в числовых данных всегда есть шум. Всякий раз, как вы пытаетесь что-либо измерить, вы чуточку промахиваетесь мимо истинного значения, будь то экономические показатели страны, количество оставшихся в мире редких орангутанов, скорость субатомной частицы или даже просто рост человека. В случае с измерением роста, например, человек может немножко сгорбиться, мерная рулетка может сдвинуться на пару миллиметров или вы случайно запишете неверное значение. Это называют погрешностью (или ошибкой) измерения, и ее сложно полностью избежать, хоть и существуют способы ее уменьшить[200].
Столь же назойливым спутником исследований, как погрешность измерения, является ошибка выборки. Как ученые мы редко когда – если это вообще выполнимо – можем изучить все до единого проявления некоего феномена, неважно, исследуем ли мы совокупность клеток, или экзопланет, или хирургических операций, или финансовых сделок. Вместо этого мы берем выборки и пытаемся по ним сделать общие выводы для группы объектов в целом (статистики называют всю группу объектов “популяцией”, даже если речь идет не о группе людей). Беда в том, что характеристики любой сделанной выборки (скажем, средний рост всех людей в вашем исследовании) никогда не будут в точности тем, что вы действительно хотите узнать (допустим, средний рост всех жителей страны). В каждой выборке будет свое, чуть другое среднее, зависящее просто от того, кто по случайности в нее попал. А для каких-то выборок, опять-таки по чистой случайности, значение может получиться сильно отличным от истинного среднего для группы в целом[201].
Как погрешность измерения, так и ошибка выборки непредсказуемы, но они предсказуемо непредсказуемы. Всегда можно ожидать, что данные по разным выборкам, измерениям или группам будут иметь несколько разные характеристики – в терминах среднего самое большое и самое маленькое значения, да и, в сущности, все остальное. Поэтому даже если обычно погрешность измерения и ошибка выборки – досадные помехи, они могут сослужить добрую службу, обеспечивая способ выявить сфабрикованные данные. Если набор данных выглядит слишком приглаженным и аккуратненьким, чересчур похожим для разных групп, тут наверняка кроется что-то странное. Как выразился генетик Джон Бёрдон Сандерсон Холдейн, “человек – животное упорядоченное”, ему “крайне трудно имитировать разупорядоченность природы”,