Этот пост познакомит вас с учебным планом, который поможет вам окунуться в мир науки о данных.
Отказ от ответственности. В этом сообщении будут ссылки на бесплатные онлайн-курсы. Каждая из этих программ была оценена мной. Если есть лучший курс, не стесняйтесь комментировать этот пост :).
Введение
Эта учебная программа была создана для того, чтобы хорошо понять магию, стоящую за горячими темами науки о данных, а также объединить ее с чистыми навыками разработки программного обеспечения. Наша цель — стать аналитиком/ученым/инженером полного стека, способным не только создавать и выбирать лучшие модели, но и развертывать их пакетно или онлайн, взаимодействуя с озерами данных.
Список наук о данных
- Введение в реляционные базы данных от Udacity.
- SQL для анализа данных от Udacity.
- Введение в бизнес-аналитику от Coursera.
- Введение в описательную статистику Udacity.
- Введение в инференциальную статистику от Udacity.
- Анализ данных с помощью R от Udacity.
- Машинное обучение от Udacity.
- A/B-тестирование от Udacity.
- Машинное обучение от Coursera (Эндрю Нг).
- Большие данные для дата-инженеров от Coursera.
Навыки программирования
Чтобы преуспеть в приведенном выше списке курсов, будет полезно иметь основы программирования на некоторых из самых популярных языков в этой области, таких как Python, R и Java (или языки JVM, такие как Scala). Список курсов, которые помогут получить некоторый опыт владения этими языками, указан ниже.
- Введение в программирование на Python от Udacity.
- Проектирование RESTful API от Udacity.
- Тестирование ПО от Udacity.
- Введение в Java от Udacity.
- Объектно-ориентированное программирование на Java от Udacity.
Вывод
Выводы ясны; мы пытаемся создать надежные наборы навыков, которые могут хорошо понимать, что такое исследовательский анализ данных, как его можно использовать в моделях машинного обучения, производственной реализации для онлайн- и оффлайн-приложений, что такое большие данные и связанные с ними технологии.