Get Mystery Box with random crypto!

Классная статья в PolicyViz про хороплет карты и подбор цветов | настенька и графики

Классная статья в PolicyViz про хороплет карты и подбор цветов для них.

Вообще, карты не всегда самый лучший способ отображения ваших данных. Понять и сравнить конкретные значения по географическим областям по ней тяжело, но вот находить какие-то паттерны в зависимости от гео контекста как раз полезно и удобно. Важно, что то, каким образом вы закодируете данные (цвета для областей, размеры точек) будет напрямую влиять на их восприятие.

Есть 4 основных способа:
- линейный – непрерывная цветовая шкала, в которой каждое значение данных получает свой оттенок, такая дефолтно в Tableau
- равные интервалы – делим диапазон данных на n интервалов и помещаем все географические наблюдения в эти интервалы. Например, на карте с четырьмя бинами и диапазоном данных от 1 до 100 мы получаем четыре равные группы (1-25, 26-50, 51-75 и 76-100). По факту не особо отличается от линейного, тк у нас будет разное количество наблюдений в каждом интервале
- интервалы распределения данных – когда у нас одинаковое количество наблюдейни в каждом интервале, варианты разбиения на квартили (4 группы), децили (10) и тд.
- произвольные интервалы – создатель карты сам задает интервалы и кто в них попадет

Один из вариантов решения проблемы – не доверять алгоритмам, а вычленять интервалы самостоятельно в зависимости от отличаемости данных. Нарисовать график с абсолютами и процентной разницей между этими категориями и сгруппировать их по похожести. Попробовала, надо прямо посидеть подумать над группировкой, пыталась применить какой-то алгоритм по отсечению разницы отклонений, но недодумала.

Очень хорошо пересекается со статьей от Lisa Charlotte Muth про хороплеты, вместе с этой я как-то еще больше прониклась логикой раскраски.

картинки следующим постом, ничего не влезло((