MLOps Engineer [Trust and Safety]
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Wildberries и Russ — лидер рынков e-commerce и наружной рекламы в России и странах СНГ.
Ежедневно более 4 тысяч наших IT-специалистов создают цифровую экосистему, состоящую из сотен тысяч продуктов. На сегодня мы создали крупнейшую онлайн-платформу для покупки и продажи товаров в России и странах СНГ.
Вместе с масштабным развитием IT-направления мы формируем культуру Trust and Safety, гарантируя непрерывную безопасность и доверие между компанией, её сотрудниками, пользователями и клиентами.
Мы направление модерации в отделе Trust & Safety, отвечаем за безопасность и модерацию контента и карточек товаров на Wildberries. Ежедневно через наши системы проходят десятки миллионов карточек товаров, мы обрабатываем сотни миллионов решений по более чем 100 различным ML-моделям. Модели инферятся через Nvidia Triton Inference Server.
Ищем MLOps инженера так как количество DS-ов растет и их уже 20+ только в модерации. Назрела необходимость реализовать общие удобные автоматизированные процессы для всей команды. У нас есть собственные VM для обучения моделей, на которых DS-ы обучают модели, в компании развернут ClearML для общих пайплайнов обучения, используются векторные БД pgvector.
Планируем расширять команду на все направления отдела Trust & Safety, поэтому нужно строить инфраструктуру с прицелом на масштабирование и стандартизацию процессов.
Наши задачи:
- Развивать и автоматизировать ML-пайплайны обучения и деплоя моделей
- Продумывание архитектуры GPU kubernetes кластеров
- Поддерживать и оптимизировать Nvidia Triton Inference Server для ускорения инференса моделей
- Общаться с DS-ами, понимать их потребности и переводить в технические решения
- Поддерживать машины для обучения моеделей с развернутыми Portainer и JupyterHub
- Масштабировать архитектуру на весь отдел Trust & Safety
Необходимые опыт и навыки:
- Знание одного из: ClearML, Kubeflow или аналогичных MLOps платформ
- Опыт работы с Nvidia Triton Inference Server
- Опыт работы с Kubernetes и контейнеризацией ML-сервисов
- Опыт DevOps практик: CI/CD, инфраструктура как код, мониторинг
- Понимание Docker и оркестрации контейнеров
- Проактивность и желание получить результат
- Умение взаимодействовать с DS-командой
Будет плюсом, если у тебя есть:
- Опыт работы и развертывания Qdrant
- Понимание векторных БД и их оптимизации
- Опыт работы c Helm, Ansible
Что мы предлагаем:
- Полная удаленка или свободное посещение офисов в Москве и Санкт-Петербурге
- IT-ипотека и оформление в аккредитованную IT-компанию
- Бесплатное питание в офисах, ДМС со стоматологией (после испытательного срока)
- Корпоративное обучение и IT-мероприятия
Наш процесс найма:
- 30-минутное HR интервью, чтобы рассказать о себе и узнать больше о вакансии
- Техническое интервью (лайфкодинг) длительностью 1 час
- Интервью MLOps 1,5 часа
- Финальное интервью с лидом длительностью 1 час