美团LongCat-Video视频生成模型发布可输出5分钟长视频 - cnBeta.COM 移动版(WAP)

返回上一页首页 | cnbeta报时: 10:07:29

美团LongCat-Video视频生成模型发布可输出5分钟长视频

发布日期:2025-10-27 12:05:16 稿源：凤凰网科技

10月27日，美团官方宣布，美团LongCat团队正式发布LongCat-Video视频生成模型。该模型基于Diffusion Transformer架构，可支持文生视频、图生视频及视频续写三类核心任务，并宣称在开源模型中达到先进水平。

据介绍，LongCat-Video可生成720p分辨率、30帧率的高清视频，其突出特点在于能够原生生成长达5分钟的连贯视频内容。模型通过视频续写预训练、块稀疏注意力等机制，旨在解决长视频生成中常见的画面断裂、质量下降等问题，保持时序一致性与运动合理性。

在效率方面，该模型采用二阶段生成、块稀疏注意力及模型蒸馏等技术，据官方表示推理速度提升超过10倍。模型参数量为136亿，在VBench等公开测试中表现出较强的文本对齐与运动连贯性。

作为构建"世界模型"的技术尝试，LongCat-Video未来或可应用于自动驾驶模拟、具身智能等需要长时序建模的场景。该模型的发布标志着美团在视频生成与物理世界模拟领域迈出重要一步。

查看网友评论返回完整版观看

最新资讯

加载中...

传Xbox可能会帮助受影响工作室完成已公布游戏

俄罗斯缺油加剧民众抢购中国电动车

美国能源部被曝已删除约6000个与能源节约相关的网页

苹果A20 Pro或采用96位LPDDR6 内存打破13年传统

NASA 紧急发起太空任务挽救Swift伽马射线观测卫星

美国三座微型核反应堆先后实现临界数据中心密切关注潜在供电新方案

Google新广告整活设想开国先贤用AI重写《独立宣言》

Midjourney要求好莱坞制片厂公开自身使用生成式AI的具体情况

火星陨石中发现石榴石或有助于重绘其早期地质史

詹姆斯·韦伯揭示了41光年外地狱般的熔岩世界

iOS 27源码曝光苹果全新可穿戴设备支持“视觉智能”

今日最热

加载中...

iPhone 18 Pro泄密影响恶劣印度政府机构调查塔塔

豆包、千问将下线智能体功能

iPhone 18 Pro/Pro Max国行电池揭晓 5391mAh史上最大

蒋方舟回应硕士论文造假，称清华教授举报材料含ChatGPT截图

Deepseek调价居然和电有关算电协同到底是怎么个“协同”？

特朗普设想“总统团聚”：奥巴马、拜登、布什，来白宫看场球赛吧

北大研发首款神经动力学芯片比英伟达GPU提速478倍

特斯拉得州事故司机曾搜＂FSD太保守＂手动加速后冲进住宅

全球极端热应激现象正不断加剧频率、强度、持续时间全线走高

PlayStation用户取消PS Plus订阅集体抗议索尼

新型激光成像技术首次实时捕捉体内微塑料运动轨迹

返回上一页首页 | cnbeta报时: 10:07:29

文字版标准版电脑端

© 2003-2026