Стройте и релизьте слой оркестрации агентов. Оптимизуйте вибир моделей, латентнисть и стоимость для тысяч агентов.
ЛокацияОтдалено (ЕС)
ТипПолная зайнятисть
Зарплата$110k, $160k + equity
О роль
Наш agent orchestration layer маршрутизуе миллионы разговоров на месяц между LLM, voice-моделями и custom skills. Вы володитимете его эффективность, надийнистю и стоимостью.
Мы оптимизуем под sub-300мс response time в voice и sub-2с в чати. Подбираем модели под запрос на основи компромисов качество vs стоимость. A/B-тестуем промпты в проди. Вы робитимете все это и больше.
Это hands-on инженерная роль с суттевими research-компонентами. Вы писатимете код, читатимете papers, запускатимете експерименты и релизитимете в продакшн.
Что вы будете делать
Володиете model serving и orchestration-слоем
Оптимизуете latency, стоимость и качество через провайдеров (OpenAI, Anthropic, in-house)
Постройте evaluation harnesses and A/B testing infrastructure
Дослиджувати и релизить улучшение RAG, tool-use и multi-step reasoning
Менторите других инженеров с ML best practices
Кого мы шукаем
5+ лет ML engineering, 2+ годы production LLM-систем
Глибокий Python; досвид с vLLM, Triton или подибними inference-серверами
Сильне systems thinking, вы debug-или production-latency или cost issues
Комфортно читаете research-папэры и прототипуете ихни идеи
Бонус: досвид distributed systems
Переваги и бонуси
Remote-firstОпцион / equityМедицинское страхование$2k бюджет на обучениеCompute-бюджет на експерименты
Подать заявку на Senior ML Engineer
Расскажите о себя. Мы читаем кожну заявку и отповидаем протягом 1 робочого недели.