音频初创公司 Krisp 周三表示,它正在推出一项新功能,利用人工智能在通话过程中实时改变用户的口音。该公司最初推出的功能是将印度英语口音改为美国英语。
该初创公司表示,口音转换过程会保留说话者的声音,只切换音素以匹配美国口音。该功能显然已在企业环境中进行了测试,测试版现已在 Krisp 桌面应用程序中推出。用户可以在通话期间或通话前随时启用该功能。
该公司联合创始人阿托·米纳斯扬 (Arto Minasyan) 表示,该功能的想法源于他在交谈中遇到的一个问题。“尽管我的英语说得很好,但很多人听不懂我的口音。我们认为改变口音可能会帮助人们更好地理解对方。我们两年前就开始着手解决这个问题,现在我们正在发布测试版,”米纳斯扬说。
然而,记者测试该功能时发现,处理后的语音听起来不太自然,有时甚至会漏掉一些单词。该公司将这些缺陷归咎于这是测试版,并表示该模型会随着时间的推移而改进。
Krisp 声称,当它与企业测试该功能时,销售转化率上升了 26.1%,客单价增长了 14.8%。
该公司表示,之所以决定首先研究印度口音,是因为印度人在 STEM 领域占全球劳动力的很大一部分。他们计划增加对更多口音的支持,包括菲律宾口音。
其他初创公司,如GV 支持的 Sanas,已经在呼叫中心大规模部署了类似的技术。
该公司表示,它利用涵盖不同口音和方言的数千个语音样本对该模型进行了训练,并在征得用户同意后使用了会议助理的数据。该功能的另一个优点是它不需要对用户的声音进行任何预先训练,因为它可以实时为说话者创建个人资料。
Krisp 上一次融资是在 2021 年,该公司计划今年发布 iOS 和 Android 应用程序,以支持面对面会议。此外,该公司还在开发一款新的 Chrome 扩展程序,以便更好地与 Google Meet 集成。