谷歌推出新款轻量级语言模型 Gemma:小而强大

Lasted 2024-02-23 21:16:39

谷歌即将推出两款新的开放式大型语言模型(LLM),分别名为 Gemma 2B 和 Gemma 7B。与 Gemini 不同,这两款模型只包含解码器模型,被设计为“轻量级”,专注于文本生成。它们提供了开放权重、预训练变体和指令调整变体。

谷歌表示,这些新产品非常适合文本生成任务,如回答问题和总结信息,但它们更小、更易于部署。由于 Gemma 模型尺寸较小,用户可以在资源有限的环境中轻松使用,包括笔记本电脑、台式机或个人云基础设施。

Iris.ai 的首席技术官维克多-博特夫称赞谷歌的举措,认为小型语言模型的能力正在迅速增长。他补充道,这将帮助许多组织克服采用人工智能的障碍。谷歌表示,Gemma 将通过“民主化获取”人工智能模型,促进公平竞争。到 2024 年,谷歌将如何利用 Gemini 和多模态人工智能来发挥其潜力,以及它为何能够抢占微软的市场先机。

小型语言模型不仅易于部署,而且对于许多使用案例来说,较少的参数数量更有效。与使用较大的模型并期望它们在多种任务中表现出色相比,较小的模型在执行核心任务时表现更为可靠。博特夫指出,实际应用比庞大的参数数量更为重要,尤其是考虑到大型语言模型的巨额成本。