База знаний / статья

Оценка качества кластеризации: свойства, метрики, код на GitHub

читать на Хабре

В 2013 году автору статьи довелось поучаствовать в разработке очень сложного алгоритма кластеризации. Требовалось с очень высоким качеством кластеризовать сотни тысяч объектов и делать это быстро: за десятки секунд на одной машине. Первым делом нужно было построить систему оценки качества, и в этой статье будет рассказываться именно о ней.