Советы, которые помогут вам выделиться из толпы и получить работу от опытного лидера в области науки о данных
Вступление
Наука о данных - очень привлекательная карьера по многим причинам, поэтому конкуренция может быть жесткой. Некоторые из приведенных ниже советов, которые помогут выделить отличного кандидата, могут вас удивить!
Я написал эту статью для самых разных аудиторий:
- Возможно, вы только начинаете и пытаетесь получить свою первую роль
- Вы можете заниматься второстепенной технической сферой и хотите переключиться
- Или вы, возможно, уже являетесь опытным специалистом по обработке данных, желающим освежить свои навыки.
Почему это так сложно?
Это вопрос, который я часто задаю на группах пользователей и на мероприятиях сообщества для начинающих или начинающих профессионалов в области данных. Это конкурентная среда, и барьеры для входа на рынок меняются - больше не требуется иметь докторскую степень, как это было, когда я только начинал. По мере роста конкуренции становится все труднее отличаться от технических способностей.
Зачем меня слушать?
Я был там - по обе стороны стола! Я опытный специалист по данным, который прошел через старшие должности и руководители групп, вплоть до должностей уровня директора в технологических стартапах.
Я быстро продвигался по карьерной лестнице и считаю, что изложенные ниже моменты в значительной степени способствовали этому.
На более высоких должностях я провел собеседование и нанял десятки кандидатов - от талантливых и тихих профессионалов до странных и замечательных (спросите меня как-нибудь о вампире-скейтбордисте). Я проходил собеседование на самые разные должности, в том числе:
- Специалисты по данным
- Инженеры по машинному обучению
- Инженеры данных
- Аналитики
- BI-разработчики
- Инженеры DevOps, консультанты по CRM, менеджеры проектов…
Во всем этом опыте есть ключевые темы и навыки, которые обычно выделяются (СПОЙЛЕР: это в основном нетехнические навыки). Я поделюсь с ними своим мнением ниже и попробую дать несколько советов, как их улучшить.
Технические навыки
Теперь, чтобы начать, я не буду вдаваться в подробности, какие алгоритмы вам следует знать, какие статистические книги вам следует изучить или какой стек машинного обучения вам следует выбрать. Существует множество курсов, многие из которых бесплатные, которые дадут вам отличную подготовку в этой области. Я учился во время учебы в докторантуре через бесплатные источники вроде this, но есть много способов получить нужный опыт.
Широкий или глубокий?
Лучше быть универсалом или специалистом? Это не вопрос, специфичный для науки о данных, он применим ко многим ролям в сфере технологий. На этот вопрос также нет однозначного ответа, это действительно зависит от типа организации, в которой вы хотите работать. Если вы мечтаете получить роль в известной технической команде или исследовательской группе, сосредоточив внимание на одном - изучении каждого аспекта машины Модель обучения не будет работать так хорошо, как действительно глубокое исследование этой ниши. Эта область слишком велика, чтобы быть экспертом во всем (даже не отставать от исследований в одной части может быть достаточно сложно).
Однако если вы хотите стать частью первых шагов организации в области науки о данных или хотите работать в только что зарождающемся стартапе, то обычно лучше всего иметь широкую перспективу. Знание инструментов и методов, используемых в отрасли, позволит вам решать более широкий круг проблем и с большей готовностью узнать, как извлечь пользу из данных при изменении потребностей и требований.
Выдающиеся кандидаты часто имеют Т-образную форму. Они хорошо разбираются в более широкой области, но специализируются в одном. Часто это более полезный подход к вашей карьере! Это позволяет вам сосредоточиться на том, что вам нравится, и действительно подчеркивает ваши сильные стороны, при этом имея возможность перейти к другим типам проектов.
Совет №1. Т-образная форма вашего опыта позволит вам сконцентрироваться и продемонстрировать свой конкретный опыт, но при этом внести свой вклад в динамичную команду, занимающуюся широким кругом задач.
Покажи свои слабости
Люди часто думают, что нужно все знать и показывать, особенно когда дело касается собеседований. На самом деле это не так, и те, кто пытается это сделать, часто очень плохо проходят собеседование. Я чувствую настоящее облегчение, когда кандидат прямо говорит мне, что он чего-то не знает, - это укрепляет доверие и взаимопонимание.
Наука о данных - большая и сложная область. Никто не является экспертом во всем этом. Если статистика не для вас, будьте открыты.
Как и многие другие, вы можете быть программистом-самоучкой, и в этом случае не спотыкайтесь, проходя тесты по кодированию, выдыхая ответы на экзаменах, которые вы напихали накануне вечером, не понимая почему.
Если вы наткнетесь на дверь, притворившись на собеседовании, первые несколько месяцев, если вы устроитесь на работу, будут неприятными.
Совет №2. Честно расскажите о своих слабостях и том, чего вы не знаете. Часто очень легко распознать, когда кто-то блефует, и вы действительно не хотите оказаться в роли, которая не позволяет вам сиять.
Программная инженерия
Подавляющее большинство людей, которые претендуют на роль в области науки о данных, потратили все свое время на обучение машинному обучению, статистике, программированию и, возможно, некоторым навыкам визуализации. Когда вы начинаете приучать их к шаблонам проектирования или подходам к разработке программного обеспечения, они полностью отключаются.
Существует большая разница между кодированием хитроумных маленьких моделей в блокнотах Jupyter и созданием надежных рабочих процессов машинного обучения, которые можно легко упаковать, протестировать и масштабировать в производственную среду.
Найдите время, чтобы изучить основы разработки программного обеспечения. Даже если вам не придется использовать его так часто, вы будете взаимодействовать с разработчиками программного обеспечения на протяжении всей своей карьеры. Они разработали решения многих проблем, с которыми сталкиваются специалисты по данным в начале своей карьеры, так что учитесь у них. Кроме того, если вы наняты техническим специалистом в компании, велика вероятность, что начальник вашего отдела или технический директор изначально был инженером-программистом - умение говорить на их языке пойдет вам на пользу.
Начать работу может быть непросто, но вы не ошибетесь, если начнете изучать основные темы в следующих двух книгах:
Совет № 3 - Изучите основы разработки программного обеспечения. Это упростит вашу работу, сделает код более надежным и позволит вам лучше взаимодействовать с другими частями вашей организации.
Готово и работает
Для большинства организаций наиболее полные и продвинутые модели бесполезны, если ими могут управлять только специалисты по данным. Многие команды по обработке и анализу данных и проекты машинного обучения терпят неудачу, потому что не могут выйти за пределы стадии исследования.
Вам не нужно быть экспертом в области контейнеров и оркестровки (если вы не хотите быть инженером машинного обучения), но превращение ваших моделей в ценность - ключевая часть вашей роли. Я почти всегда задаю вопрос:
Как вы получите свою модель в руки нетехнического пользователя?
На одном из лучших собеседований я когда-либо говорил, что кандидат указал мне на подготовленный ими код и на очень простое веб-приложение, в котором размещена модель. Я сразу же смог поиграть с этим и задать вопросы о том, что они сделали.
Если вы хотите начать работу с MLOps, я написал небольшую серию статей, в которой подробно описал бы пример:
Совет №4. Развивайте понимание методов и инструментов для развертывания вашей работы в производственной среде. Знание базовых MLOps покажет, что вы понимаете, что разработка модели - это лишь небольшая часть работы.
Докажите это
Иногда бывает сложно попасть даже на собеседование. Это хорошо согласуется с примером, приведенным в последнем совете. В вашем приложении нет ничего более убедительного, чем свидетельство того, что вы уже проделали такую работу.
Если я просматриваю резюме и натыкаюсь на одно со ссылкой на GitHub, я всегда проверяю его и часто посвящаю этому человеку больше времени, чем я выделил. Это даже не обязательно должны быть полностью оригинальные проекты, важнее видеть, как вы решаете проблемы. Если вы только начинаете и у вас нет большого портфолио работ, опубликуйте свою курсовую и напишите комментарий о том, как вы над ней работали. Это поможет вам провести собеседование до его начала, так как ваш собеседник почти наверняка спросит об этом.
Есть много других способов показать свою работу. Рассматривайте ведение блога по мере того, как вы учитесь (с Medium очень легко начать). Не бойтесь выступать перед людьми в Интернете через YouTube или на встречах и мероприятиях - это также поможет освежить некоторые жизненно важные навыки межличностного общения.
Необязательно быть экспертом, чтобы способствовать обучению людей. Если вы не уверены в этом или не знаете, с чего начать, я настоятельно рекомендую прочитать некоторые из работ Остина Клеона, например эту статью:
Или эта замечательная книга описывает это более подробно:
Совет № 5 - Продемонстрируйте то, что вы знаете. Наличие проектов на GitHub, блог, в котором рассказывается о некоторых вещах, которые вы узнали, обсуждения и мероприятия, или активный канал YouTube позволят вам выделиться из толпы.
Заключение
Сегодня я попытался рассказать, какие технические навыки, по крайней мере, для меня, выделяют отличного кандидата в области науки о данных. Если все это для вас ново или сложно, выберите одно и начните с малого. Если вы начнете вести блог и добавлять на GitHub по ходу дела, вы начнете оттачивать свои навыки и обретете уверенность.
Получить для вас подходящую роль может быть непросто. Многие люди оценят более разностороннего кандидата, способного взаимодействовать в рамках всей организации. Простое знание большинства алгоритмов или новейших инструментов - не лучший способ выделиться при приеме на работу.
Надеюсь, эти советы помогут вам получить работу. Если у вас есть отзывы, я буду очень признателен вам. Если вы также являетесь менеджером по найму в этой сфере, я хотел бы узнать ваши мысли.
Дальнейшее чтение
Ниже приведен список других ресурсов, которые могут оказаться полезными. Эта статья о программной инженерии Ахмеда Бесбеса - отличный старт, если вышеупомянутые книги немного тяжелы:
И это отличное введение и обзор некоторых недавних идей MLOps от Винсента Татана:
Отказ от ответственности: эта статья не содержит партнерских ссылок.