微软这么快就集成了GPT-4,如何做到的?项目组甚至周末加班了
4月6日消息,微软已将OpenAI的GPT-4集成到Microsoft 365生产力应用套件中,这是一项非常艰巨的任务,但公司一直希望能够尽快完成。因此,微软动员了数百名员工,让他们长时间加班工作,一起头脑风暴产品方案,基于一个统一的设计框架,开发出三种人工智能助手的工作模式。
以下是翻译内容:
“3-16”
过去几个月里,这是在微软的会议室和走廊里被无数次提及的一个词。它指的是3月16日,当天微软宣布将与OpenAI共同开发的生成式AI模型引入Microsoft 365生产力应用套件中。通过集成GPT-4,包括Outlook、Word和Teams在内的每个生产力应用程序都将拥有基于生成式人工智能的Copilot(智能副驾驶)。目前,20多个微软客户正在对这项技术进行测试。
将人工智能助手集成到如此多的应用程序中是一项艰巨的任务,但微软希望尽快完成。去年11月,OpenAI发布的ChatGPT引发了全球轰动,掀起了一场人工智能竞赛,各家企业都在争分夺秒地推出新的人工智能产品和功能,以抢占市场先机。即使是已经与OpenAI合作和投资过的微软也不例外
微软设计总监乔恩·弗里德曼(Jon Friedman)负责Microsoft 365中的Copilot产品设计。他表示这个项目需要数百名微软员工的长时间工作,包括设计师、工程师、产品经理、营销人员、数据科学家以及道德伦理团队等等,整个项目要持续几个月时间,甚至需要在周末加班。弗里德曼说,这个计划还需要人们克制自我,共同努力,才能在如此短的时间内建成如此大的项目,让大家都感到他们必须放下自我,团结一致。
弗里德曼说:“我们可以一起做一些真正大胆而重大的事情,这让人很兴奋。虽然我们在人工智能方面拥有很多经验,但这种特殊的生成式人工智能更强大,所以我认为每个人都在抱着学习的心态工作。”
全新的用户体验
弗里德曼认为,Copilot是一种“对话式用户体验”的新形式,它可以调用更多丰富的资源。他表示,Copilot是一款办公助手,代表了“用户界面设计的新前沿,就像第一代触屏设备一样改变既定模式”。据悉,Copilot是基于GPT-4大型语言模型开发,预训练了大量互联网内容,并可以访问微软Graph中的业务数据,从而自动生成电子邮件和会议要点等内容。
设计Copilot这种用户界面的挑战在于,在人们通常使用Word和Powerpoint等应用程序进行工作时,如何以及何时展示这个全新的人工智能助手。
弗里德曼表示,最初设计这种可以通过各种生产力应用程序调用的人工智能助手只是“一个模糊的想法”。但随着设计团队对人工智能助手在实际业务中的应用有更深入的了解,这种想法开始逐渐明确。首先,设计团队需要发现人工智能在实际应用中可以明显节省用户时间或以某种方式激发创造力等具体用例,这是用户体验设计过程的第一步。
最了解相关用例的人包括每个生产力应用程序的工程师、产品经理、设计师和计算机科学家。弗里德曼的设计团队与他们通力合作。在Copilot项目启动时,他要求所有产品团队共同头脑风暴,探讨如何利用生成式人工智能来提升生产力应用程序的功能。接着,弗里德曼成立了一个特殊的横向设计团队,与所有应用程序团队合作,以在每个应用程序中展示Copilot的效果。
弗里德曼表示,随着各个应用程序团队开始制定用例,横向设计团队开始注意到这些用例之间的共性,即与多个应用程序相关的人工智能用例。
弗里德曼回忆起当时的头脑风暴过程时说:“我们的讨论非常有价值……我们讨论的是Copilot具体的功能需求,例如新的生成式语言模型如何帮助我们更好地完成写邮件摘要的任务?”
随着跨应用用例变得越来越清晰,横向设计团队开始认为,每个应用程序的人工智能助手功能并不需要各自不同。
弗里德曼表示:“因为你有很多人……试着观察各个场景,能够大致做出这种判断,比如说‘啊,也有这个东西出现了’。”
因此,他们开始构思一个设计框架,让一个通用助手以几种不同的可预见方式在各个应用程序中工作。
三个层次的Copilot
弗里德曼领导的设计团队创建了一个深度文档库,旨在帮助整个项目的设计师在给定的应用程序中为人工智能创建切入点。他们指导设计师根据用户可能参与的不同任务确定如何调用Copilot。弗里德曼说:“有这样一个观念,Copilot应该在正确的层次出现,完成正确的工作。”
设计框架规定,Copilot在应用程序用户界面中可以有三种展示方式。
第一种是身临其境的用户体验,让人工智能助手专注于具体业务项目,而不是某个特定的应用程序,这样实际上可以从多个应用程序中提取数据或要点,服务于手头的工作。例如,Copilot可能会从团队会议、幻灯片或电子邮件内容中收集项目里程碑或风险点,然后在项目计划文档中进行总结和归纳。
“沉浸式”体验模式是Copilot在生产力应用套件中最强大的功能,也可能是最有影响力的。市场咨询公司恩德勒集团(Enderle Group)首席分析师鲍勃·恩德勒(Rob Enderle)认为,这也可能有助于解决Microsoft生产力套件长期以来存在的问题——各个应用程序之间的集成不够紧密。 恩德勒说,原因可能是最初微软是从其他公司相继收购这些应用程序,彼此之间并没有共用代码库。但Copilot可以覆盖到所有应用程序,至少能让用户感觉到这些应用程序能在某些任务中协同工作。
弗里德曼说,第二种展示方式是“辅助”,这意味着Copilot就像挎斗三轮摩托车的“边斗”,在特定的应用程序中帮助用户最大限度地调用应用程序功能。例如,在PowerPoint中,Copilot可以向用户展示应用程序的深层图形功能如何用于描述复杂数据集;在Outlook中,Copilot可以帮助用户理解电子邮件中最重要的内容;在Word中,Copilot可以提供有关如何更好编写文档、贴合特定写作风格的反馈意见。
此外,在Copilot的“嵌入式”展示方式中,人工智能可以在应用程序中发挥生成式和创造性能力。例如,Copilot可能会出现在Word文档的弹窗中。“这就像是一种随机体验。” 弗里德曼说,“当你全身心投入工作时,Copilot可以帮助你解决写作瓶颈,或者自动用文本内容帮助你开始做幻灯片。”
弗里德曼表示,Copilot的横向设计团队开始采用“三个层次”的概念来描述这项工作,各个应用程序团队的成员也逐渐接受了这个框架。
他说,“我们已经与首席执行官纳德拉和公司高管团队的其他成员分享了这个框架,并且基本上得到了所有人的认可。这种想法可以适用于三个不同的工作层次。”
Copilot这个名字不是专门为Microsoft 365而设立的。微软旗下的GitHub在2021年曾使用这个名字来称呼编程助手,其中部分功能也采用了OpenAI的大型语言模型。而微软正在创建一个具有一致性的Copilot助手,能够在不同的生产力应用套件中执行某些标准化功能。对于长期使用生产力应用程序的用户,这项新工作很可能会减少他们在新版Microsoft 365正式推出时所遇到的生疏感。通过使用统一的助手,用户可以更方便地使用不同的应用程序,从而提高工作效率。
随着生成式人工智能进一步融入微软的消费级和企业级产品,Copilot品牌和概念可能会扩展到Windows操作系统甚至LinkedIn等微软其他产品。
“纳德拉非常喜欢这个名字,因为它恰如其分地描述了人工智能助手的工作,”弗里德曼说。“它的存在是为了帮助你,在许多任务中指引你的方向……”(辰辰)