华为发布开源技术SINQ：可大幅降低大模型硬件需求一张4090就能跑 - cnBeta.COM 移动版(WAP)

返回上一页首页 | cnbeta报时: 07:09:59

华为发布开源技术SINQ：可大幅降低大模型硬件需求一张4090就能跑

发布日期:2025-10-06 00:10:40 稿源：快科技

据报道，华为苏黎世的实验室发布了一种新的开源量化方法，可在不牺牲大模型输出质量的情况下，减少显存需求。该技术名为 SINQ（Sinkhorn-Normalized Quantization），目前已在GitHub和Hugging Face上开源，采用Apache 2.0许可，允许企业和研究机构免费使用、修改和商业部署。

SINQ的核心优势在于其快速、无需校准，并且易于集成到现有模型工作流中，通过独特的量化方法，将模型的显存需求降低了60%至70%，具体取决于模型架构和位宽。

这意味着原本需要超过60GB显存才能运行的模型，现在可以在大约20GB的环境中运行。原本需要在高端企业级GPU（如A100或H100）才能运行的大模型，如今可在更经济的硬件上运行，例如单张RTX 4090。

SINQ已在多种架构和模型（如Qwen3系列、LLaMA和DeepSeek）上进行了评估，并在WikiText2和C4等基准测试中表现出色，显著降低了困惑度和翻转率。

它还支持非均匀量化方案（如NF4），并可与校准方法（如AWQ）结合使用，进一步缩小与全精度模型的差距。

在运行效率方面，SINQ的量化速度比HQQ快约两倍，比AWQ快30倍以上，非常适合对量化时间有实际限制的研究和生产环境。

查看网友评论返回完整版观看

最新资讯

加载中...

马斯克出庭猛烈抨击OpenAI 称“没有人因为Grok自杀”

NASA突然为登月计划新增一次载人试飞

美国政府机构对使用马斯克的Grok聊天机器人发出警示

Anthropic公开叫板五角大楼陷入“双输”困局？

Altman称在五角大楼AI合作问题上与Anthropic划下相同“红线”

章泽天播客时隔45天更新对话中国速登珠峰第一人曾燕红

反诈老陈因多次违规被罚抖音账号已搜索不到

詹姆斯·韦布望远镜在银河系外发现复杂有机化学环境

Tether公司称已冻结与犯罪活动相关的42亿美元稳定币

憋尿能提升游戏水平？研究称膀胱控制状态减少冲动

PSSR升级版将在未来几周上线《生化危机9》成首款采用该技术的游戏

今日最热

加载中...

极客湾疑似遭"全网封杀"!背后力量深不可测？

网友网购一条32GB DDR5内存打开包裹竟收到十条

Netflix放弃收购华纳兄弟派拉蒙胜出

好莱坞知名演员在自家谷仓意外身亡汽车搭电时突然自燃

全新奥迪A6L实车到店车长超5米

《中华小当家》最新话：小当家复活失败！

全球汽车销量前10出炉中国3家上榜丰田稳坐第一

尽管盈利创纪录英伟达股价为何下跌？

金·凯瑞获终身成就奖

NVIDIA显卡驱动罕见大翻车 Bug连天紧急回档

微软发布Copilot Tasks 面向大众的自动化AI任务助手

返回上一页首页 | cnbeta报时: 07:09:59

文字版标准版电脑端

© 2003-2026