Что будет, если взять 604 модели Playboy за последние 50 лет и поискать выбросы (outlier detection) и аномалии (anomaly detection) в данных с помощью реализации одноклассовой машины опорных векторов (One-class Support Vector Machine) в библиотеке Scikit-learn, написанной на языке Python?
Можно, например, узнать основные статистические характеристики признаков девушек. Как и следовало ожидать, средние формы модели Playboy — 89-60-88, вес — 52 кг. А вот средний рост — 168 см. Неожиданно невысокий рост, видимо, объясняется тем, что обработанные данные с середины ХХ века, сейчас стандартный рост модели около 180.
Полный спектр данных можно проследить на вот этих графиках.
А на этом графике видно, что за все это время было 7 «аномалий».
Oдна из таких «аномалий» Розмари Хилкрест. Октябрь, 1964. 104-64-97, рост 168, вес 66.
Посмотреть на другие «аномалии», узнать как их вычислять и где еще применить, можно на Хабрахабре.