The datasaurus dozen — статья о том, что с заданными средним значением и отклонением для X и Y, а также их корреляции, можно построить практически любое распределение точек, да хоть динозавра. Мысль довольно простая: если мы уменьшаем размерность данных и пытаемся вместо десятка наборов X и Y использовать 5 значений, то мы привносим в данные серьёзную неопределённость.