返回上一页  首页 | cnbeta报时: 05:30:49
Google推出Gemini 3.1 Flash TTS文本转语音模型 支持近70种语言
发布日期:2026-04-16 03:39:52  稿源:cnBeta.COM

Google宣布在其 Gemini 3.1 系列中推出一款全新的文字转语音模型 Gemini‑TTS,被官方描述为“至今最富表现力的文本转语音解决方案”。 新模型能够生成听感自然、高保真的语音,同时允许开发者通过提示词(prompt)控制语音的情感、节奏和风格,例如在旁白或对话中精确调节语气、停顿与情绪变化。

在多语言支持方面,Gemini‑TTS 覆盖约 70 种语言,包括中文(普通话)、英语、西班牙语、德语、日语等主流语言,模型可自动检测输入文本的语种,无须手动标注语言类型即可生成对应语音。 这一能力使得开发者和企业可以在有声读物、播客、语音助手、客服机器人、教育应用等场景中,用一套统一的 API 为全球用户提供多语种语音内容。

Google还强调,Gemini‑TTS 与 Gemini 3.1 系列的其他音频模型(如 Gemini 3.1 Flash Live)协同,进一步强化了“实时语音体验”的能力。 在实时对话、语音翻译及多模态交互中,系统可以在保持低延迟的同时,通过文本提示和音频标记精细控制语音输出,让 AI 代理在电话、会议、导航等场景下更接近自然的人类语音交互。

查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 05:30:49

文字版  标准版  电脑端

© 2003-2026