Публикации по теме 'k-means-clustering'


Используйте метод локтя, чтобы определить, сколько кластеров требуется для неконтролируемого обучения.
В Kaggle очень мало соревнований, связанных с кластеризацией, поэтому всякий раз, когда они возникают, я хватаюсь за возможность делать прогнозы по кластерам. Кластеризация — это метод машинного обучения, используемый для группировки похожих точек данных вместе на основе присущих им характеристик или сходств. Это неконтролируемый метод обучения, то есть…

Обучение без учителя - K-средства и иерархическая кластеризация
Набор данных цветов ириса - это небольшой набор данных, содержащий всего 150 строк (по 50 строк для каждого из 3 типов цветов ириса: сетоса, разноцветный и вирджинский). Виды определяются по 4 характеристикам: ширина чашелистика , длина чашелистика , ширина лепестка и длина лепестка . Анализ данных и разработка функций Длина и ширина чашелистиков имеют несколько нормальное распределение, но длина и ширина лепестков не соответствуют гауссовскому распределению. Итак,..

Какой район Манхэттена лучше всего подходит для вашего нового зоомагазина?
Введение Манхэттен, штат Нью-Йорк, вероятно, является самым многолюдным местом в США: более 1,6 миллиона человек проживают на площади 22,8 квадратных миль. Здесь есть много возможностей для ведения бизнеса, так как очень много людей нуждаются во всевозможных услугах. Однако здесь также очень сложно вести бизнес из-за высокой арендной платы и множества конкурентов. Учитывая разнообразие 40 районов Манхэттена, первый вопрос всегда звучит так: «Где мне открыть свой бизнес?» Моя..

Сегментация клиентов: неконтролируемая кластеризация K-средних с использованием программирования R.
У меня есть навязчивая идея уборки и непреодолимое желание неоднократно организовывать свою среду обитания; Одно из занятий по уборке, которое мне действительно нравится, — это классификация всех приправ/ингредиентов для приготовления пищи на кухне на основе их характеристик , таких как уровень специй, цветовая гамма, размер упаковки и т. д. Возможно, именно поэтому эта техника обучения без учителя приносила мне такое удовлетворение каждый раз, когда я ее применяла! Существует..

Исследование данных Airbnb с помощью кластеризации K-средних с нуля
"Машинное обучение" Исследование данных Airbnb с помощью кластеризации K-средних с нуля Кластеризация K-средних - что это такое? Прежде чем мы углубимся в набор данных Airbnb и наши выводы, давайте сделаем углубленный обзор алгоритма кластеризации K-средних. Учащийся без учителя получает немаркированные данные обучения и делает прогнозы для невидимых точек. Кластерный анализ относится к обучению без учителя. Кластер - это набор объектов данных, которые похожи (или связаны)..

K означает кластеризацию с помощью кода Python
Упрощенный алгоритм обучения без учителя для решения задач кластеризации K означает, что кластеризация - еще один упрощенный алгоритм машинного обучения. Это классифицируется как обучение без учителя, потому что здесь мы уже не знаем результата (не знаем, какой кластер будет сформирован). Этот алгоритм используется для векторного квантования данных и взят из методологии обработки сигналов. Здесь данные разделены на несколько групп, точки данных в каждой группе имеют схожие..