0

Scikit-learn: K-Means – Метод "Локтя" для определения числа кластеров

11

Описание проблемы:

Сегодня я пытаюсь разобраться с методом K-средних (K-means). Я понимаю алгоритм и знаю, как он работает. Теперь мне нужно определить оптимальное количество кластеров k. Я нашёл метод "локтя" (elbow criterion), который помогает определить правильное значение k, но не понимаю, как его использовать с библиотекой scikit-learn.

В scikit-learn я кластеризую данные следующим образом:

kmeans = KMeans(init='k-means++', n_clusters=n_clusters, n_init=10) 
kmeans.fit(data)

Должен ли я запускать этот алгоритм несколько раз с n_clusters от 1 до n и следить за уровнем ошибки, чтобы определить правильное значение k? Мне кажется, что это будет неэффективно и займет много времени. Как лучше подойти к этому вопросу?

0 ответ(ов)

Чтобы ответить на вопрос, пожалуйста, войдите или зарегистрируйтесь