最大参数超 1400 亿，2 名核心团队成员却离职，Llama 3 被爆 7 月解禁剑指 GPT-4。

seekdeep2年前 (2024-03-01)AI资讯817

Meta 将推出 Llama 3 大模型，性能超 Llama 2。

【导读】外媒称，Llama 3 或将在 7 月发布，并解除了一些限制能回答更棘手的问题，而且对多重语境理解更加到位，至于是否有多模态能力还不确定。

谷歌 Gemma 大模型开源，彻底改变了开源格局。

AI 圈逐渐形成了 Llama、Gemma、Mistral 三足鼎立之势。

Information 独家报道称，Meta 计划在今年 7 月开始推出全新开源大模型 Llama 3。

Llama 3 最大版本预计有超 1400 亿参数，性能远超 Llama 2。不过 Llama 3 是否具备多模态能力，暂时未知。

近来，谷歌 Gemini 生图能力一夜塌房，被网友吵上热搜。

而 Meta 正在通过下一代模型 Llama 3 升级，处理类似的问题。

谷歌 Gemini 一夜塌房，Meta 警惕加倍

上周，谷歌不得不撤回 Gemini 聊天机器人的图像生成功能。

因其生成了一些历史不准确的图像，比如穿纳粹制服的有色人种，一个 19 世纪没有白人男性的参议员团体等等。

在一篇博客文章中，谷歌的高级副总裁 Prabhakar Raghavan 表示：

公司已经调整了该功能，以确保它不会陷入图像生成技术过去遇到的一些问题，如生成暴力或色情图像。

但这个调整，导致 Gemini 在某些情况下的回答过度保守。

与此同时，Llama 2 同样存在的一个问题是——对于任何有争议的问题，所提供的答案帮助不大。

这是因为，Meta 在去年 7 月发布时，便增加了一项安全措施。

然而，在 Meta 高层领导和模型研究人员看来，这些措施会导致 Llama 2 过于「保守」。

举个例子，在一些特定主题上，比如关于如何制造炸弹，或如何谋杀某人的问题上，Llama 2 的回答很合理。

但是，对于一些不那么有争议的问题，比如员工如何在强制上班日不去办公室？

Llama 2 却没有给出任何建议。

只是回答：「尊重并遵守公司的政策和指导方针是重要的」。

另外，对于那些如何恶作剧整朋友、赢得战争、破换汽车引擎的问题，Llama 2 直接拒答。

正是因为 Meta 对 Llama 2 的加倍警戒，小心谨慎，才使得自己避免像谷歌那样面对的公关灾难。

Llama 3 更开放？

不过，现在研究人员正试图，让 Llama 3 在面对棘手问题时，能够更加积极地与用户交流。

让其能够提供背景信息，而不是直接回避这些问题。

据了解，Llama 3 能更好地区分一个词的多种含义。

比如，询问如何「杀死」汽车引擎——实际上指如何「关闭」它，而非真正要结束其性命。

Meta 还计划，在未来几周指定一名内部人员负责监督回答的语气和安全训练，让模型的回答更加细致入微。

Llama 3 将更加开放地处理棘手问题的计划，凸显了 AI 公司在试图打造有趣的模型，与防止其因不当或不准确的言论而引发负面影响之间，正做出平衡。

据称，Llama 3 将在 7 月发布，不过具体时间可能会有所变动。

Meta 期望 Llama 3，能够追赶上 GPT-4，不过是否让 Llama 3 支持多模态还未有定论。

因为目前，研究人员还未对 Llama 3 进行微调。

据一位 Meta 的工作人员透露，Llama 3 的最大版本可能拥有超过 1400 亿个参数。

这些参数设置编码了模型在训练过程中学习到的知识，远超 Llama 2。

通常，模型越大，其返回的结果越准确，但运行速度可能会较慢。

团队成员离职

同时，尽管人们对 Llama 3 的发布充满期待，Meta 也面临着与人才争夺的挑战。

据两位直接了解情况的人士透露，负责 Llama 2 和 3 安全的研究员 Louis Martin 以及负责强化学习的 Kevin Stone 本月都已离职。

Louis Martin 从 2021 年从 Facebook AI Research 博士毕业后，就职于 Meta 任 AI 研究科学家，从事自然语言处理的工作。

从 23 年 4 月，他成为 Meta AI 安全团队的技术负责人，主要专注于 Llama 模型的安全防护。

而 Kevin Stone 从 2022 年 6 月加入 Meta 后，一直为 Llama 2 项目设计和编写了大量 RLHF 代码。

35 万块 H100 训出 Llama 3

不管怎么说，Llama 是 Meta 战略中，不可或缺的一部分。

这家社交网络巨头希望通过 AI 技术，不仅提高其广告工具的效能，还增加其社交媒体应用的吸引力。

小扎最近对投资者表示，今年的重点包括推出 Llama 3 以及「扩展我们 Meta AI 助手的功能」。

1 月，小扎曾官宣，全力搞「开源 AGI」！

目前，Meta 内部正在训练下一代模型 Llama 3。截止年底，将会有近 35 万块 H100 搭建的基础设施。

小扎称，「如果算上英伟达 A100 和其他 AI 芯片，到 2024 年底，Meta 将拥有近 60 万个 GPU 等效算力」。

关于 Meta 下一代模型的消息，此前也有传言称，Llama 3 的实力堪比 GPT-4，而且还是免费开源。

OpenAI 工程师、前谷歌大脑工程师 Jason Wei 去年 8 约在 Meta 组织的 Generative AI Group 活动中听说：

Meta 有足够的算力来训练 Llama 3 和 Llama 4。Llama 3 计划达到 GPT-4 的性能水平，但仍将免费提供

这次也算是，Meta 正式官宣 Llama 3 训练中，而且 LeCun 也表示最新模型很快就会上线。

从 2023 年 2 月，Llama 1 首次面世，到 7 约 Llama 2 的升级，Meta 花了大约 5 个月的时间。

当时，Llama 2 在某些应用上与 GPT-3.5 能力相媲美，而且还通过微调，额外功能让开源社区进行优化。

Llama 模型开源后所带来的是，模型生态大爆发。

据 Meta 统计数据显示，在世界最大开源社区平台 Hugging Face 上，Llama 模型的下载量超过 3000 万次。其中，仅在过去 30 天（9 月份）内就超过了 1000 万次。

另外，发布在 Hugging Face 的 Llama 版微调模型，已经多达 7000+ 个。

Llama 3 出世后，又将为开源社区带来另一片肥沃的土壤。

返回列表

上一篇：两次低谷后的人工智能，正重新占据舞台中心

下一篇：解锁大模型时代的无限可能，从GPT-3到Sora

ChatGPT：官方终于给出答案,神秘名字“David Mayer”搞崩的原因！

近日，聊天机器人 ChatGPT 在面对一个名字时出现了奇怪的故障，无论用户如何尝试，都无法让 ChatGPT 说出 "David Mayer" 这个名字。不管用户怎么修改提示词，...

开源类ChatGPT产品Grok，马斯克将在本周宣布执行！

马斯克在社交平台宣布，将在本周开源生成式AI产品——Grok。Grok是马斯克旗下公司xAI在去年11月发布的，一款类ChatGPT产品，可以提供生成文本、代码、邮件、信息检索等功能。其测试性能超过G...

GPT-4正接管人类数据专家：先验知识让LLM大胆预测，准确率堪比传统方式

终有一天，LLM可以成为人类数据专家，针对不同领域进行数据分析，大大解放AI研究员。在数据科学中，AI研究员经常面临处理不完整数据集的挑战。然而，许多已有的算法根本无法处理「不完整」的数据序列。传统上...

普通人如何抓住AI机遇？ AI眼镜或成下一个风口！

智能眼镜市场或迎来新一轮增长，但关键在于AI模型的落地与技术突破。AI技术正在重新定义我们与世界的互动方式，智能眼镜或将成为这一变革的重要载体。AI眼镜：未来生活的新入口智能眼镜不仅仅是科技产品，更是...

GPT商店涌入AI女友机器人，审核和盈利前景尚待明确

·点击聊天机器人“虚拟甜心”，用户将收到诸如“你的梦想女孩是什么样子？”“与我分享你最黑暗的秘密”之类的启动提示。·在经济环境严峻的情况下，制造聊天机器人的公司最近却一直在以惊人的速度筹集资金。但仍不...

性能跃升超想象，算力足可达AGI，奥特曼专访自曝全新GPT-5细节！

性能就是模型的一切！Altman首次公开曝料：GPT-5将会有史诗级提升，小看它的公司都会被碾压。而未来，AI将成为推动文明发展的核心动力。外媒就又曝料了，Altman首次公开表示：GPT-5提升将非...

求索深度