Будуйте та релізьте шар оркестрації агентів. Оптимізуйте вибір моделей, латентність і вартість для тисяч агентів.
ЛокаціяВіддалено (ЄС)
ТипПовна зайнятість
Зарплата$110k, $160k + equity
Про роль
Наш agent orchestration layer маршрутизує мільйони розмов на місяць між LLM, voice-моделями та custom skills. Ви володітимете його ефективність, надійністю і вартістю.
Ми оптимізуємо під sub-300мс response time у voice і sub-2с у чаті. Підбираємо моделі під запит на основі компромісів якість vs вартість. A/B-тестуємо промпти у проді. Ви робитимете все це і більше.
Це hands-on інженерна роль з суттєвими research-компонентами. Ви писатимете код, читатимете papers, запускатимете експерименти і релізитимете в продакшн.
Що ви будете робити
Володієте model serving та orchestration-шаром
Оптимізуєте latency, вартість і якість через провайдерів (OpenAI, Anthropic, in-house)
Побудуйте evaluation harnesses and A/B testing infrastructure
Досліджувати і релізити покращення RAG, tool-use та multi-step reasoning
Менторите інших інженерів з ML best practices
Кого ми шукаємо
5+ років ML engineering, 2+ роки production LLM-систем
Глибокий Python; досвід з vLLM, Triton або подібними inference-серверами
Сильне systems thinking, ви debug-или production-latency чи cost issues
Комфортно читаєте research-папери і прототипуєте їхні ідеї
Бонус: досвід distributed systems
Переваги та бонуси
Remote-firstОпціон / equityМедичне страхування$2k бюджет на навчанняCompute-бюджет на експерименти
Подати заявку на Senior ML Engineer
Розкажіть про себе. Ми читаємо кожну заявку і відповідаємо протягом 1 робочого тижня.