Meta 昨发布大型语言模型LLaMA

2月24日,北京时间2月25日凌晨,Meta AI 正式发布了一种新的人工智能大型语言模型,LLaMA,正式加入到由微软、谷歌等科技巨头主导的AI“军备竞赛”中。

在其官网上发布的一篇题为《LLaMA 简介:一个基础的、650 亿参数的大型语言模型》(Introducing LLaMA: A foundational, 65-billion-parameter large language model)文章,Meta AI 正式发布了 LLaMA。

Meta 的发布也很引人注目,部分原因是它错过了围绕 AI 聊天机器人的一些热门话题。

考虑到微软因仓促推出整合了ChatGPT 的新 Bing 而受到的批评,谷歌在其聊天机器人 Bard 在演示中出错后股价暴跌,Meta 在错过了 ChatGPT 造成的全球热议的档期,昨日推出 LLaMA,或许有这方面的因素和其自身的考量。

过去,确实Meta 发布过自己的可访问 AI 聊天机器人,但是,反响不佳。一个名为 BlenderBot 的软件被批评只是…不太好,而另一个名为 Galactica 的软件是用来写科学论文的,因为它不停地制造科学废话,所以上线才三天就被下线了。

实际上,LLaMA不是一个系统,而是四个不同大小的模型。对于 LLaMA 四重奏,Meta 大概希望得到更友善的接待。

Meta A I官网发布的信息称:“作为 Meta 对开放科学承诺的一部分,今天我们公开发布了 LLaMA(大型语言模型元 AI),这是一种最先进的基础大型语言模型,旨在帮助研究人员推进他们在 AI 子领域的工作。”

“LLaMA 等更小、性能更高的模型使研究社区中无法访问大量基础设施的其他人能够研究这些模型,从而进一步使这一重要、快速变化的领域的访问民主化。”

与其他大型语言模型一样,LLaMA 的工作原理是将一系列单词作为输入,并预测下一个单词以递归生成文本。

为了训练这个模型,Meta AI 从使用最多的 20 种语言中选择了文本,重点是那些使用拉丁字母和西里尔字母的语言。

Meta CEO马克.扎克伯格在 Facebook 帖子中说。“LLAMA人工智能语言模型在生成文本、进行对话、总结书面材料以及解决数学定理或预测蛋白质结构等更复杂的任务方面表现出了很大的潜力。”

关于这个大型语言模型 LLaMA的使用范围,Meta AI 宣称:

Meta 致力于这种开放的研究模式,新发布的LLAMA模型将提供给 AI 研究社区使用。

“为了保持完整性并防止滥用,我们将根据专注于研究用例的非商业许可发布我们的模型。将根据具体情况授予学术研究人员访问该模型的权限;隶属于政府、民间社会和学术界组织的人员;和世界各地的行业研究实验室。有兴趣申请访问的人可以在我们的研究论文中找到申请链接。”

自留地君提出了试用申请,不确定是否会有机会实际试用。

同时,在官网上,Meta AI 还发布了题为《LLaMA:开放且高效的基础语言模型》(LLaMA: Open and Efficient Foundation Language Models)的论文。

点赞、转发、随心赏给您分享这篇标志性文献

https://ai.facebook.com/