腾讯混元宣布推出5个全新3D生成模型,模型生成速度更快、细节更丰富、材质表达更逼真,并且全部开源。同时,其自研的 3D AI 创作引擎也迎来升级,新增多视图输入、模型智能减面、格式全兼容等能力,面向C端用户全面开放使用。
据悉,5个开源模型均基于Hunyuan3D-2.0打造,其中 Turbo 系列模型在保证高精度和高质量的基础上,对几何生成模型进行了数十倍的加速,确保整个生成过程能够在 30 秒内完成。
这一加速能力来源于腾讯混元提出的 3D 生成加速框架FlashVDM ,它突破了传统模型的效率壁垒,将大规模 3D 模型的生成时间提升到秒级范围,对开源社区和工业界部署都具有重要价值。
多视图版本模型,例如Hunyuan3D-2-MV,通过结合多个视图的输入信息,能够更好地捕捉细节并生成符合用户预期的 3D 资产。而轻量级mini 系列模型,通过模型架构优化与运行效率提升,可进一步降低算力成本,其几何模型可以部署在4080显卡甚至苹果M1 Pro芯片上,为模型的应用扩展了场景。
腾讯于2024年11月发布第一代 3D 生成大模型,在行业内率先支持文本和图像生成3D内容,2025年1月,腾讯混元3D生成大模型发布2.0版本(Hunyuan3D-2.0 ),在文本一致性、几何精度和画面质量等多维度评测中表现超越业内排名第一的大模型。
得益于模型的进步,面向创作者的C端应用腾讯混元3D AI 创作引擎也迎来升级。
新版引擎突破性支持多视图输入,只需上传2-4张标准视角图片,就能快速生成高精度、高质量的3D模型,针对游戏制作、3D UGC创作等场景,可以大幅降低3D设计师从多视图原画到三维模型的制作成本。
腾讯混元 3D AI 创作引擎可通过3D智能减面能力,自适应生成几百至数千面的三角面,进一步提升几何边缘平滑度,生成结果可在低面片的基础上最大化体现模型细节,让模型布线更加规整,以降低渲染难度,提升模型可用率及生产效率。
此次升级还实现了PBR(基于物理渲染技术)的材质生成效果提升,通过物理特性模拟技术,赋予模型更真实的颜色与材质表达,让数字资产在光影交互中展现电影级质感。
兼容性上,除通用OBJ、GLB、FBX外,可输出STL、USDZ及MP4等主流格式,无缝连接3D打印工具,也可支持模型快速预览及移动端实时交互,满足不同业务场景对3D模型格式的使用要求。
在腾讯,混元3D 生成模型已经开始应用于用户生成内容(UGC)、商品素材合成、游戏3D资产生成等场景,游戏业务中,大模型生成的3D模型已能满足部分游戏3D资产标准,包括几何布线合理性、贴图准确性与骨骼蒙皮合理性等。