返回上一页  首页 | cnbeta报时: 15:57:46
GPT-4.5发布:比GPT-4提升10倍 但"并非前沿模型"
发布日期:2025-02-28 09:49:07  稿源:网易科技

2月28日消息,美国时间周四,OpenAI宣布推出GPT-4.5,这是其最新、最强大的大语言模型(LLM)的研究预览版,专为聊天应用设计。不过,这也是OpenAI迄今为止最昂贵的模型。

不过,GPT-4.5仍然是一款传统的大型语言模型,而非“推理模型”。此前,OpenAI、DeepSeek、Anthropic等公司都推出了推理模型,这些模型能够生成“思维链”或类似意识流的文本,通过反思自身的假设和结论,尝试在向用户提供响应或输出之前捕捉错误。

尽管如此,OpenAI联合创始人兼首席执行官山姆·奥特曼(Sam Altman)在社交平台上表示,GPT-4.5是“第一个让我感觉像是在与一个有思想的人交谈的模型。我曾多次靠在椅背上,惊讶于AI能给出真正有用的建议。”


奥特曼还提醒道,由于GPU供应紧张,OpenAI不得不限制对GPT-4.5的访问。他指出:“坏消息是:这是一个庞大且昂贵的模型。我们本打算同时向Plus和Pro用户推出,但用户量大幅增长导致GPU资源不足。我们计划下周增加数万颗GPU,并随后向Plus订阅用户开放。(很快还会有数十万颗GPU到位,我相信大家会充分利用我们部署的每一颗GPU。)这并不是我们理想的运作方式,但很难完美预测导致GPU短缺的需求激增。”

从美国时间周四开始,GPT-4.5将向OpenAI的最昂贵订阅服务ChatGPT Pro(每月200美元)的用户开放,并向所有付费API层级的开发者提供访问权限。OpenAI还计划在下周将其扩展至价格相对较低的Plus和Team层级(每月20/30美元)。

GPT-4.5支持搜索功能和画布模式,用户还可以上传文件和图像,但目前还不支持其他多模态功能,如语音模式、视频和屏幕共享——至少暂时不支持。

通过无监督学习推动AI进步

GPT-4.5代表了人工智能训练领域的显著进步,尤其是在无监督学习方面,这大大提升了模型识别模式、建立联系以及生成创造性见解的能力。

OpenAI的研究人员提到,GPT-4.5通过基于较小人工智能模型生成的数据进行训练,这有助于提升其“世界模型”。他们还表示,该模型同时利用多个数据中心进行预训练,这意味着它采用了一种类似于竞争对手Nous Research的去中心化方法。

这种训练方式显然帮助GPT-4.5学会了生成更自然、更直观的交互,同时更准确地遵循用户意图,并展现出更高的情商。该模型在OpenAI此前关于人工智能扩展的工作基础上取得了突破,进一步验证了“增加数据和计算能力有助于提升人工智能性能”的理念。

与前代模型及其他同类产品相比,GPT-4.5预计能够显著减少幻觉现象(幻觉率为37.1%,相比之下GPT-4为61.8%),从而使其在处理广泛话题时更加可靠。

GPT-4.5的突出特点

根据OpenAI的说法,GPT-4.5旨在创造亲切自然、直观流畅的对话。它对语义细微差异和上下文有更强的把握能力,能够实现更像人类之间的互动,并更有效地与用户协作。

GPT-4.5通过扩展的知识库和敏锐的细微线索解读能力,在多个领域展现出色表现,包括:

——写作辅助:优化内容、提升清晰度、激发创意

——编程支持:调试、提出代码改进建议、自动化工作流程

——问题解决:提供详细解释,并协助做出实际决策

此外,GPT-4.5还采用了新的对齐技术,增强了其对人类偏好和意图的理解能力,进一步提升了用户体验。

如何访问GPT-4.5?

从美国当地时间周四开始,ChatGPT Pro用户可以在网页、移动端和桌面端的模型选择菜单中选择GPT-4.5。OpenAI计划在下周将该模型扩展到Plus和Team用户。

对于开发者,GPT-4.5将通过OpenAI的API提供,包括Chat Completions API、Assistants API和Batch API。它支持函数调用、结构化输出、流式传输、系统消息和图像输入等关键功能,使其成为多种人工智能驱动应用的通用工具。不过,GPT-4.5目前尚不支持语音模式、视频或屏幕共享等多模态功能。

定价及对企业决策者的影响

企业和团队领导者可以充分利用GPT-4.5带来的各种功能。凭借较低的幻觉率、增强的可靠性和自然流畅的对话能力,GPT-4.5能够支持广泛的业务功能:

——改善客户互动:企业可以将GPT-4.5集成到支持系统中,以实现更快、更自然的互动,同时减少错误

——增强内容生成:营销和传播团队可以高效地制作高质量、符合品牌的内容

——精简运营:人工智能驱动的自动化可以帮助调试、优化工作流程并支持战略决策

——可扩展性和定制化:API允许企业进行量身定制,构建符合其特定需求的人工智能解决方案

然而,对于希望通过GPT-4.5构建应用的第三方开发者来说,GPT-4.5的API定价高得惊人,每百万输入/输出token的价格为75美元/180美元,而GPT-4o的定价仅为2.50美元/10美元。

随着其他竞争对手模型的发布——如Anthropic的Claude 3.7、Google的Gemini 2 Pro,以及OpenAI自家的推理“o”系列(o1、o3-mini High、o3)——GPT-4.5的性能提升是否足以抵消其高昂成本,特别是在通过API使用时,将成为一个值得关注的问题。

AI研究人员与资深用户的早期反应两极分化

GPT-4.5的发布在社交平台上引发了人工智能研究人员和技术爱好者的广泛讨论,尤其是在该模型的“系统卡”(即概述其训练和评估的技术文档)提前泄露后,文档中包含了一系列官方公告前的基准测试结果。

OpenAI在泄露后发布的最终版系统卡与泄露版本存在显著差异,删除了泄露版中“GPT-4.5并非前沿模型,但它是OpenAI最大的LLM,比GPT-4的计算效率提高了10倍以上”的表述。OpenAI的发言人表示,这一说法并不准确。

人工智能模型提供商Nous Research的联合创始人Teknium(化名)对OpenAI的新模型表示失望,指出在多语言理解(MMLU)和实际编码基准测试中,GPT-4.5相比其他领先的大语言模型(LLM)的改进微乎其微。Teknium质疑道:“距离GPT-4发布已经过去2年多,OpenAI投入的资金投入规模扩大上千倍……究竟发生了什么?”

此外,有人认为,GPT-4.5在软件工程基准测试中表现逊于o3-mini,这让人质疑此次发布是否代表了真正的技术进步。

然而,也有部分用户为GPT-4.5的潜力辩护,认为其价值不应仅仅依赖于基准测试的结果。

软件开发人员Haider(@slow_developer)强调,GPT-4.5相比GPT-4在计算效率上提升了10倍,并且其在综合任务处理能力上优于OpenAI专注于STEM领域的o系列模型。

AI新闻发布者Andrew Curran(@AndrewCurran_)则从定性角度出发,预测GPT-4.5将在写作和创造性思维领域树立新标准,并称其为OpenAI的“杰作”。

这些讨论凸显了人工智能领域一个更广泛的争论:技术进步是否应单纯通过基准测试来衡量,还是应更侧重于推理能力、创造力和拟人化交互等定性方面的改进?

仍处于研究预览阶段

OpenAI将GPT-4.5定位为研究预览版,以深入了解其优势与局限性。该公司表示,将继续探索用户与模型的互动方式,并挖掘非常规应用场景。

OpenAI称:“我们发布GPT-4.5作为研究预览版,以更好地了解其优势与局限性。扩展无监督学习将继续推动人工智能的进步,提升准确性、流畅性和可靠性。”

随着OpenAI不断改进其模型,GPT-4.5为未来的人工智能进步奠定了基础,尤其是在推理和工具使用代理方面。尽管GPT-4.5已经展示了令人印象深刻的能力,OpenAI仍在积极评估其在生态系统中的长期作用。

凭借更广泛的知识库、更高的情商和更自然的对话能力,GPT-4.5将为各个领域的用户带来显著改进。OpenAI期待看到开发者、企业和团队如何将该模型集成到他们的工作流程和应用中。

随着人工智能技术的不断进步,GPT-4.5标志着OpenAI在追求更强大、更可靠、更符合用户需求的语言模型道路上迈出了重要的一步,为企业领域的创新带来了新的机遇。(小小)

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 15:57:46

文字版  标准版  电脑端

© 2003-2025