Програмное обеспечение, позволяющее визуализировать статистическую информацию. Помощники инфографера. Для того, чтобы визуализировать информацию, не обязательно быть дизайнером. Накопилось уже много всяких разных инструментов от всем известного Excell до специализированных инструментов для журналистов Knightlab. Мы делимся с вами самым интересным в этом разделе. А какие инструменты знаете вы? Делитесь в комментариях к данному разделу. Присылайте письма.
Что будет, если взять 604 модели Playboy за последние 50 лет и поискать выбросы (outlier detection) и аномалии (anomaly detection) в данных с помощью реализации одноклассовой машины опорных векторов (One-class Support Vector Machine) в библиотеке Scikit-learn, написанной на языке Python?
Можно, например, узнать основные статистические характеристики признаков девушек. Как и следовало ожидать, средние формы модели Playboy — 89-60-88, вес — 52 кг. А вот средний рост — 168 см. Неожиданно невысокий рост, видимо, объясняется тем, что обработанные данные с середины ХХ века, сейчас стандартный рост модели около 180.
Полный спектр данных можно проследить на вот этих графиках.
А на этом графике видно, что за все это время было 7 «аномалий».
Oдна из таких «аномалий» Розмари Хилкрест. Октябрь, 1964. 104-64-97, рост 168, вес 66.
Посмотреть на другие «аномалии», узнать как их вычислять и где еще применить, можно на Хабрахабре.