Публикации по теме 'analytics'


Очистка данных с помощью Python — Наука о данных
В науке о данных одним из основных процессов получения хорошо обработанных данных для анализа является «Очистка данных». И вот где Python сияет, когда дело доходит до анализа данных. Очистка данных — это процесс выявления и исправления или удаления ошибок, несоответствий и неточностей в данных с целью повышения их качества и обеспечения их точности и надежности для анализа. В Python есть различные библиотеки и инструменты, которые можно использовать для очистки данных. В этом дискурсе мы..

Python: рейтинг страницы и спортивная аналитика
Перераспределение алгоритма на триллион долларов для рейтинга спортивных команд На днях я опубликовал статью об использовании моделирования Монте-Карло, чтобы сойтись на распределении вероятностей лотереи. Теоретически он набирает обороты намного быстрее, чем ряд моих предыдущих статей. Это может означать либо, что (А) читатели очень интересуются методами Монте-Карло, либо (Б) читатели очень интересуются спортивной аналитикой. Держу пари, что спортивная аналитика является здесь..

Линейная регрессия — глубокое погружение
Когда мы просто вызываем линейную регрессию , она обычно помечается как простая линейная регрессия. С точки зрения непрофессионала, линейная регрессия — это модель, которая обеспечивает взаимосвязь между двумя переменными. Чтобы уточнить, он обеспечивает связь между одной предикторной (независимой) переменной и другой целевой (зависимой) переменной. Я знаю, что у вас в голове наверняка возник бы один вопрос: Если линейная регрессия целиком посвящена взаимосвязи между двумя переменными,..

Вы разрушаете пузырь данных?
Натали Фолко, супервайзер цифровых медиа, Сан-Паулу В мире, где преобладают алгоритмы машинного обучения, мы привыкаем к потреблению специально подобранного контента. Это феномен, из-за которого мы можем забыть, что есть и другая сторона вещей - другие точки зрения, выходящие за рамки нашего собственного, - сформированные разными типами людей с разным опытом. Эта тенденция может быть очень опасной для тех, кто работает в аналитике, как и я. Хорошие новости: это также может..

Создавайте с помощью пользовательских источников данных в реальном времени
Принимайте и комбинируйте данные программно, используя очень гибкие входные таблицы. Девин Смит Динамические данные поступают из различных источников. Работа с этими данными в режиме реального времени открывает множество возможностей для аналитики и приложений. В современных системах важны не только хорошо известные протоколы, такие как Kafka, но и ваши пользовательские источники. Во многих случаях вам может понадобиться передавать данные из приложений без подключения Kafka...

Что нужно, чтобы создать идеальный шторм для данных
«Мы верим в Бога; все остальные должны предоставить данные ». - Эдвин Р. Фишер Представьте себе это. Мир. Новый мир. Это мир, в котором никто не теряет друга из-за урагана, потому что не было времени на подготовку. Это мир, в котором никто не теряет члена семьи из-за рака, потому что мы не обнаружили ложного роста клеток с самого начала. Это мир, в котором каждая машина достаточно умна, чтобы избежать аварий, которые убили бы нас и людей, о которых мы заботимся. Нам не..

UC Berkeley MIDS (магистр наук о данных) Обзор
Это личный отзыв о программе MIDS Калифорнийского университета в Беркли , в которой я в настоящее время участвую. Если вы рассматриваете возможность подачи заявки или участия в программе, этот пост для вас! Для контекста: большую часть времени в программе я работал полный рабочий день в технологической отрасли. Немного логистики о программе, программа предлагает 14 курсов на выбор. Студенту необходимо пройти 8 из этих курсов в дополнение к обязательному завершающему проекту, чтобы..