为智能应用设置语音与识别能力
语音配置概述
SenseFlow创新地支持了克隆音色、文生音色和音色融合,期待您创造出更加生动的音色。
为应用配置个性化语音功能可以显著提升用户体验,实现更自然的人机交互。以下是主要配置步骤:
语音合成设置
音色选择
选择适合的声音类型和语言,您可以根据应用场景选择不同性别、年龄和语言的音色:
- 基础音色:提供多种预设的男声、女声音色
- 情感音色:支持不同情绪表达的音色变化
- 多语言支持:支持中文、英文等多种语言的 语音合成
- 个性化音色:支持克隆音色和自定义音色创建
语音参数调节
- 语速控制:调整语音播放的快慢程度
- 音调调节:设置语音的高低音调
- 音量控制:调整语音输出的音量大小
- 停顿设置:配置语音中的自然停顿
实时预览
您可以在调试区域实时预览语音合成的效果:
- 试听功能:即时听到配置后的语音效果
- 文本测试:输入测试文本验证语音质量
- 效果对比:对比不同配置下的语音效果
语音识别配置
在语音识别配置中,您可以进行以下设置:
识别精度设置
- 标准模式:适用于一般场景,平衡识别速度和准确性
- 高精度模式:适用于对准确性要求较高的场景
- 实时模式:适用于需要实时响应的交互场景