亚马逊宣布推出Nova多模态AI模型系列

摘要:

亚马逊的云计算部门亚马逊网络服务(AWS)在其 re:Invent 2024 大会上宣布了一个名为 Nova 的新的生成式人工智能多模态模型系列。该系列共有四种以文本为重点的模型(可接收文本、图像或视频并输出文本的模型):Micro、Lite、Pro 和 Premier。

亚马逊首席执行官安迪-贾西(Andy Jassy)在台上说,Micro、Lite 和 Pro 目前已面向 AWS 客户提供,而 Premiere 将于 2025 年第一季度推出。

IMG_6848.webp

除此之外,还有一个图像生成模型 Nova Canas 和一个视频生成模型 Nova Reel。 这两个模型目前都可以公开使用。

贾西说:"我们正在继续研究我们自己的前沿模型,在过去的四五个月里,这些前沿模型取得了巨大进步。 我们认为,如果我们发现了它们的价值,你们也可能会发现它们的价值。"

基于文本的 Nova 模型主要根据其功能和大小来区分。

  • Amazon Nova Micro - 纯文本模型,具有最低的延迟响应,上下文长度为 128K 标记。 它还支持微调和模型提炼,以提高准确性。 目前已全面上线。

  • Amazon Nova Lite - 一种成本极低的多模态模型,可处理图像、视频和文本输入,并生成文本输出。 它支持长度达 300K 标记的输入,可在单次请求中分析图像或长达 30 分钟的视频。 它还支持微调和模型提炼,以提高准确性。 目前已全面上线。

  • Amazon Nova Pro - 高性能多模态模型,可处理多达 30 万个输入词元。这款新模型在关键基准上实现了最先进的性能。 它支持 30 万个代币的输入上下文,可作为教师模型,用于提炼亚马逊 Nova Micro 和 Lite 的自定义变体。 目前已全面上线。

  • Amazon Nova Premier - 亚马逊即将推出的用于复杂推理任务的能力最强的多模态模型,目前仍在培训中。 预计将于 2025 年初全面上线。

  • Amazon Nova Canvas - 一种图像生成模型,可根据提示中提供的文本或图像创建图像。 它还支持使用文本输入和用于调整配色方案和布局的控件编辑图像。 目前已全面上线。

  • Amazon Nova Reel - 一种全新的先进视频生成模型,可根据文本和图像创建高质量的 6 秒视频。 亚马逊将在 2025 年支持 2 分钟的视频。 亚马逊 Nova Reel 将支持控制视觉风格和节奏的功能,包括使用文本提示控制摄像机运动。 它已于今日全面上线。

Jassy 说:"亚马逊正在开发语音到语音模型和"任意到任意"模型,应该会在 2025 年年中左右推出。您可以输入文本、语音、图像或视频,也可以输出文本、语音、图像和视频。"

热门评论

>>共有0条评论,显示0
更多评论
created by ceallan