Scikit-learn: K-Means – Метод "Локтя" для определения числа кластеров
Описание проблемы:
Сегодня я пытаюсь разобраться с методом K-средних (K-means). Я понимаю алгоритм и знаю, как он работает. Теперь мне нужно определить оптимальное количество кластеров k. Я нашёл метод "локтя" (elbow criterion), который помогает определить правильное значение k, но не понимаю, как его использовать с библиотекой scikit-learn.
В scikit-learn я кластеризую данные следующим образом:
kmeans = KMeans(init='k-means++', n_clusters=n_clusters, n_init=10)
kmeans.fit(data)
Должен ли я запускать этот алгоритм несколько раз с n_clusters от 1 до n и следить за уровнем ошибки, чтобы определить правильное значение k? Мне кажется, что это будет неэффективно и займет много времени. Как лучше подойти к этому вопросу?
scikit-learn: Как вернуть предсказанное значение 'y' к исходному масштабу
Ошибка времени выполнения: ожидался скалярный тип Long, но найден Float
Как изменить порядок столбцов в DataFrame?
'pip' не распознан как командa внутреннего или внешнего формата
Почему statistics.mean() работает так медленно?