エンドユーザーが話すと予想される「言語(language)」の設定が必須です。また、全体のタイムアウトや、指定秒数の無音状態でキャプチャーを停止する無音タイムアウト(maxSilence)も設定できます。
詳細は以下のドキュメントをご参照ください。
Call APIの場合 - 音声のキャプチャー
https://ib.nttcpaas.com/docs/api/channels/voice/calls/call-legs/call-capture-speech
IVRの場合 - Voice IVR (自動音声応答)シナリオの作成(以下画像参照ください(赤枠部分))
https://ib.nttcpaas.com/docs/api/channels/voice/interactive-voice-response/manage-ivr-scenarios/create-a-voice-ivr-scenario