Hugging Face HUGS 加快了基于开放模型的AI应用的开发

0 cnBeta.COM 2024-10-24 14:35:16

摘要：

在过去一年左右的时间里，开源人工智能模型在性能上已经明显赶上了 OpenAI、Google 和其他公司的流行闭源模型。然而，由于在不同硬件上部署和维护这些模型所带来的开销，开发人员尚未广泛采用这些模型。为了解决这个问题，Hugging Face 今天发布了 Hugging Face Generative AI Services（HUGS），这是一个面向开发者的优化、零配置推理微服务，可以加速基于开放模型的 AI 应用程序的开发。

HUGS 模型部署还提供了与 OpenAI 兼容的 API，可直接替换建立在模型提供者 API 之上的现有应用程序。这将帮助开发人员轻松地从基于 OpenAI 模型的应用程序迁移到基于开源模型的应用程序。

HUGS 基于文本生成推理和 Transformers 等开源技术构建。它经过优化，可在各种硬件加速器上运行开放模型，包括NVIDIA GPU、AMD GPU、AWS Inferentia（即将推出）和 Google TPU（即将推出）。目前已支持 13 种流行的开放式 LLM，包括 Meta 的 LLaMa，未来还将支持更多 LLM。 HUGS 可以部署在亚马逊网络服务、Google云平台和微软 Azure（即将推出）上。 HUGS根据公共云上每个容器的正常运行时间按需定价。

据Hugging Face称，HUGS具有以下优势：