微软AI语音新技能:玩转情感程度调节
近期,微软人工智能语音增加了名为“情感程度调节”的新技能。通过这一技术,多个虚拟人物已经拥有的十余种情感变化可以进一步调节强弱程度,表现力细腻可控,更准确地还原人类情感。
以下为 B 站演示:
微软人工智能语音已经在年龄、性别、性格各异的中文角色(晓晓、云希、云野、晓涵、晓萱、晓墨、晓睿)上实现了如下情感类别:开心、悲伤、愤怒、 恐惧、 不满、 严厉、撒娇、温柔、沮丧、尴尬、平静。
不过,人类的情感很大程度上体现于语音语调的微妙变化,比如一句“再见”,有时是平静而含蓄的,有时是开心而轻松的,有时却是决绝而愤怒的。
微软人工智能语音以自适应神经网络为基础,能够把上述人类情感以1%作为一个量化单元,以平静语气为0点,通过无代码的有声内容创作平台或者使用SSML标签(语音合成标记语言),轻松控制情感程度。
此外,通过与自动文本情感分析技术相结合,也可自动预测情感类别,智能演绎饱含情绪变化的作品。这一技术让音频创作就像导演选角一样,用最适合的声音、最恰当的情感,演绎更出色的作品,适用于聊天机器人、有声书朗读、影视自动配音、游戏等多情景。