Все географические карты лгут - Марк Монмонье
Рис. 11.11. Статистическо-пространственная таблица и числовая ось с показателями среднего числа детей в одном домохозяйстве
Рис. 11.12. Хороплетные карты, отображающие идентичные картины с показателями количества электронных приборов на одно домохозяйство и числа детей на одну семью
А вот правая таблица из рис. 11.13 несколько искажает картину. Как и на левой таблице, пунктирные вертикальные линии, отходящие от осей таблицы, делят ее на сетку прямоугольников 5×5. Однако в данной таблице конфигурация категорий располагает все кружки, за исключением четырех, за пределами диагональных клеток. Таким образом, на обеих схемах несколько городов окажутся сразу в нескольких категориях. На рис. 11.14 показаны расхождения, возникающие в результате этого на схемах, что позволяет говорить в лучшем случае о слабой корреляции между ними. Такие приемы могут заставить слабое подобие карт выглядеть сильным, особенно когда схемы похожи в том, что касается высшей категории, которая обозначается самым темным цветом. И действительно, пространственное влияние самого темного и сразу бросающегося в глаза цветового символа сильно воздействует на мнение наивного пользователя об идентичности схем. Некоторые из них могут даже вынести суждение о схожести схем на основании всего лишь приблизительно равного количества символов самого темного оттенка – даже если обозначенные ими районы находятся в разных частях региона! Различные пространственные символы для двух карт и различное количество категорий – это еще одна разновидность хитростей, с помощью которых картографы обманывают пользователей карт или вводят в заблуждение себя.
Рис. 11.13. Таблицы рассеивания показателей количества приборов на домохозяйство и числа детей в семье. Пунктирные линии на левой таблице отображают границы категорий в паре карт из рис. 11.12. Такие же линии на правой таблице показывают границы категорий из рис. 11.14
Рис. 11.14. Слабая коррелляция между показателями количества приборов на домохозяйство и числа детей в семье
Другие визуальные искажения могут быть связаны с основной картой, на которой размещены соответствующие данные. Не все пространственные символы так единообразны и визуально равны, как прямоугольники, обозначавшие города в предыдущих примерах. Рис. 11.15 иллюстрирует этот момент, изображая две обманчиво выглядящие похожими карты, которые составлены на основе количественных данных и категорий визуально непохожих карт с рис. 11.14. Эти 28 городов значительно отличаются в размерах, а схожесть карт очень высока потому, что самые большие города относятся к одной категории. Города, не попадающие в нее, выглядят на обеих картах меньше и визуально оказывают на наблюдателя меньшее воздействие.
Рис. 11.15. Похожесть больших районов может искажать визуальные оценки корреляции, затушевывая значительное несовпадение между малыми районами. Количественные данные и картографические категории идентичны тем, которые выглядят гораздо более непохожими на двух картах рис. 11.14
Хотя этот пример с соотношением количество приборов / домохозяйство и является выдуманным, он совсем не атипичен. Административные районы городов, переписные районы, избирательные округа по выборам в Конгресс и другие пространственные единицы, установленные с целью включения в них примерно равного числа жителей, часто сильно отличаются друг от друга по размерам из-за различий в плотности населения. Такая неравномерность еще более заметна на картах, где густонаселенные округа с преимущественно городской застройкой, как правило, по территории значительно меньше, чем сельские округа с немногочисленными жителями. Осторожный пользователь карт никогда не выносит суждения о цифровой корреляции в зависимости от похожести изображений на карте и проявляет особую осторожность в отношении тех районов, которые значительно больше других.
Для того чтобы избежать искажений в корреляции, происходящих из-за разных размеров административных единиц, внимательный аналитик обратится к более «демократичному» методу, когда на диаграммах рассеивания идентичные точки или кружки представляют каждый район. Как показывают диаграммы на рис. 11.16, плотность и ориентация «облака» точек отражают силу и направление корреляции.
Рис. 11.16. Диаграммы рассеивания и линии тренда для различных видов корреляции
Если прямая линия обеспечивает нормальное формирование множества точек, когда они расположены недалеко друг от друга, то такая корреляция называется линейной, а степень незначительного разброса точек вокруг этой линии указывает на силу линейной корреляции. Линия положительной корреляции направлена направо вверх, а отрицательной – направо вниз; множество точек без ощутимых внутренних связей не имеет видимого направления. Для слабых корреляций характерен широкий разброс точек вокруг линии тренда, тогда как в сильных линейных корреляциях большинство точек расположено прямо на линии тренда или в непосредственной близости от нее. Не все корреляции бывают прямыми, сильная криволинейная корреляция характеризуется изогнутым трендом, которому соответствует изогнутая линия тренда.
Статистики используют определенное число, называемое коэффициентом корреляции, для измерения силы и направления линейной корреляции. Его обозначают символом r, и он показывает специальным значком направление взаимоотношений между переменными, а также силу этих взаимоотношений в ее абсолютной величине. Коэффициент r колеблется в диапазоне от +1,00 до –1,00. Для сильной положительной корреляции r составляет от 0,9 и выше; для сильной отрицательной корреляции – от –0,9 и ниже; около 0 – это показатель неопределенной или очень слабой корреляции. Существует эмпирическое правило, по которому квадрат коэффициента корреляции дает пропорцию изменений в одной переменной в зависимости от других переменных. Например, если r = –0,6, то корреляция является негативной и одна переменная может «объяснять» 36 % другой переменной. Коэффициент корреляции измеряет только зависимость величин, а не их причинно-следственную связь, которая обосновывается логикой и сопутствующими доказательствами.
Карты, диаграммы рассеивания и коэффициенты корреляции дополняют друг друга, и аналитик, интересующийся корреляцией, обычно полагается на все эти три элемента. Коэффициент корреляции, который обеспечивает возможность точного сравнения пары переменных величин, измеряет только линейную зависимость. А вот диаграмма рассеивания моментально показывает и криволинейные взаимосвязи со средним значением r. Эти диаграммы также показывают отклонения, которые могут сильно искажать вычисление r. Однако необходимость основываться на визуальных оценках снижает ценность диаграмм для сравнения силы взаимосвязей величин. Более того, диаграммы рассеивания и коэффициенты корреляции ничего не говорят о расположении той или иной местности, а карты, которые представляют нам пространственные тренды, могут обеспечить только ненадежные оценки корреляции.
Карты могут показывать другой вид корреляции, географическую корреляцию, которая отличается от статистической корреляции диаграмм рассеивания и классического коэффициента корреляции. Статистическая корреляция существует вне пространства и ничего не сообщает о пространственных трендах. Рис. 11.17 показывает это различие с помощью двух