🎓 Выбирайте обучение по отзывам. Мы запустили рейтинг лучших онлайн-школ, чтобы находить качественные курсы стало еще проще. Cмотреть рейтинг

MLOps Engineer [Trust and Safety]

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

Международная технологическая компания, лидер рынков e‑commerce и наружной рекламы в России

Описание вакансии

Wildberries и Russ — лидер рынков e-commerce и наружной рекламы в России и странах СНГ.
Ежедневно более 4 тысяч наших IT-специалистов создают цифровую экосистему, состоящую из сотен тысяч продуктов. На сегодня мы создали крупнейшую онлайн-платформу для покупки и продажи товаров в России и странах СНГ.

Вместе с масштабным развитием IT-направления мы формируем культуру Trust and Safety, гарантируя непрерывную безопасность и доверие между компанией, её сотрудниками, пользователями и клиентами.

Мы направление модерации в отделе Trust & Safety, отвечаем за безопасность и модерацию контента и карточек товаров на Wildberries. Ежедневно через наши системы проходят десятки миллионов карточек товаров, мы обрабатываем сотни миллионов решений по более чем 100 различным ML-моделям. Модели инферятся через Nvidia Triton Inference Server.

Ищем MLOps инженера так как количество DS-ов растет и их уже 20+ только в модерации. Назрела необходимость реализовать общие удобные автоматизированные процессы для всей команды. У нас есть собственные VM для обучения моделей, на которых DS-ы обучают модели, в компании развернут ClearML для общих пайплайнов обучения, используются векторные БД pgvector.

Планируем расширять команду на все направления отдела Trust & Safety, поэтому нужно строить инфраструктуру с прицелом на масштабирование и стандартизацию процессов.

Наши задачи:

  • Развивать и автоматизировать ML-пайплайны обучения и деплоя моделей
  • Продумывание архитектуры GPU kubernetes кластеров
  • Поддерживать и оптимизировать Nvidia Triton Inference Server для ускорения инференса моделей
  • Общаться с DS-ами, понимать их потребности и переводить в технические решения
  • Поддерживать машины для обучения моеделей с развернутыми Portainer и JupyterHub
  • Масштабировать архитектуру на весь отдел Trust & Safety

Необходимые опыт и навыки:

  • Знание одного из: ClearML, Kubeflow или аналогичных MLOps платформ
  • Опыт работы с Nvidia Triton Inference Server
  • Опыт работы с Kubernetes и контейнеризацией ML-сервисов
  • Опыт DevOps практик: CI/CD, инфраструктура как код, мониторинг
  • Понимание Docker и оркестрации контейнеров
  • Проактивность и желание получить результат
  • Умение взаимодействовать с DS-командой

Будет плюсом, если у тебя есть:

  • Опыт работы и развертывания Qdrant
  • Понимание векторных БД и их оптимизации
  • Опыт работы c Helm, Ansible

Что мы предлагаем:

  • Полная удаленка или свободное посещение офисов в Москве и Санкт-Петербурге
  • IT-ипотека и оформление в аккредитованную IT-компанию
  • Бесплатное питание в офисах, ДМС со стоматологией (после испытательного срока)
  • Корпоративное обучение и IT-мероприятия

Наш процесс найма:

  • 30-минутное HR интервью, чтобы рассказать о себе и узнать больше о вакансии
  • Техническое интервью (лайфкодинг) длительностью 1 час
  • Интервью MLOps 1,5 часа
  • Финальное интервью с лидом длительностью 1 час