Все публикации
AI Research 8 хв читання

Prompt engineering в продакшен-масштабе

Тактики для промптов, которые витримують миллионы разговоров, eval-и, version control и правило, что врятувало нас от инцидентов.

Анна Роман
Lead Researcher
Feb 28, 2026

Eval-и, это 80% prompt-инженерии

Бильшисть команд пишут промпты и релизят. Мы не релизимо змину промпта без прогону её через 200-кейсовий eval suite. Продакшн-инциденты от изменений промптов впали почти до нуля, отколи мы это збудували.

Ставтесь до промптов как до кода

Каждый промпт в git. Каждая изменение йде через PR review. Каждая изменение имеет revert-шлях. Звучить очевидно; много команд этого не делают.

Правило, что нас врятувало

Если изменение промпту улучшает качество в середньому, но делает worst case гиршим, не релизьте.

Середня качество, нормально, но клиенты запамьятовують worst-case взаемодию. Мы оптимизуем tail эффективность, не mean. Это правило зловило много блискучих изменений промпта, которые виглядали б чудово в eval-ах и хуже, в реальному житти.

#prompts#ml#production
Анна Роман
Lead Researcher

Ведёт наш applied ML research. Много публикацей о multi-agent системы. Вважает, что хорошие eval-и, это 80% хорошого AI.

Попробовать MyChatBot бесплатно

Настройте своего первого AI-агента за 10 минут. Картка не нужна.

Бесплатный пробний период