Почему голос, самая сложная поверхность
Текст прощает медленный, многословный ответ. Голос, нет. На звонке каждый лишний токен, это мёртвый эфир, каждый неверный поворот, неловкая тишина, и назад не прокрутить. Плоский промпт, работающий в чате, разваливается в телефоне. Голосовая архитектура должна оптимизироваться под задержку и очерёдность реплик, а не только под правильность.
Четыре слоя
Агенты MyChatBot складываются слоями. Система задаёт голосовую персону, темп и ограничители. Роль сужает задачу, напоминания, квалификация, исходящие. Память, это База знаний плюс история CRM, поэтому агент знает предложение и абонента. Инструменты, там, где он действует: запись, записи в CRM, перевод. На Calls SDK эти слои настроены держать ответы короткими и быстрыми.
Скрипты против свободной речи
Искусство, балансировать скрипт с живым разговором. Слишком по скрипту, звучит как робот; слишком свободно, расплывается и жжёт задержку. Слой роли задаёт хребет звонка, обязательные пункты, а Agentic Search добавляет конкретику по требованию. Абонент может перебить через barge-in, и агент адаптируется, не теряя места.
Что тихо жжёт кредиты
В голосе убийцы бюджета, многословные ответы, повторное извлечение контекста посреди звонка и многословный системный текст на каждом шаге, и они ещё и портят опыт как задержка. Лечится сжатыми слоями системы, узким извлечением и памятью в CRM, чтобы абонента узнавали мгновенно. В голосе стройная архитектура и дешевле, и лучше.
Проектирование живой передачи
Голосовая передача должна быть бесшовной, холодный перевод убивает доверие. Hand-off Control переводит живой звонок или планирует обратный как только появляется порог или стоп-фраза, а Flight Control уведомляет команду в Telegram. Затем запускайте через Configuration Wizard, который боево тестирует скрипт и версионирует каждое изменение, поэтому вы настраиваете темп, скрипты и переводы, никогда не начиная с нуля.