AMD 今天宣布了 Radeon RX 9070 系列开源 Linux 驱动程序,同时宣布开源 Instella 作为其全新的完全开放式 3B 参数语言模型。AMD 宣称 Instella 代表着"完全开放的最先进的 30 亿参数语言模型 (LM)"。
这些模型是在 AMD Instinct MI300X GPU 上训练的,根据 AMD 公布的数据,其性能与 Llama 3.2 3B、Gemma-2 2B 和 Qwen 2.5 3B 等同类产品相比具有很强的竞争力。
AMD的Instella模型是在Instinct MI300X硬件上从头开始训练的,并且完全开源:
"完全开放、可访问:...
通过完全开源Instella模型,包括权重、训练超参数、数据集和代码,我们旨在促进人工智能社区内的创新与合作。 我们相信,透明度、可重复性和可访问性是人工智能研究与开发取得进展的关键驱动力。 我们邀请开发人员、研究人员和人工智能爱好者探索 Instella,为其不断改进献计献策,并与我们一起推动语言模型的发展。"
想要了解有关 AMD Instella 语言模型的更多信息,请访问 rocm.blogs.amd.com 。 AMD Instella 托管于GitHub。