除了编程能力大幅提升,还有更宽松的开源协议:DeepSeek 发布 V3 模型更新!

seekdeep11个月前AI资讯6071

和上周不少朋友期待的一样,新一周第一天的北京时间 3 月 24 日晚,DeepSeek 果然「突然」发布了模型更新。

但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。

初代 V3 模型最为人所熟知的,可能还是「557.6 万美金比肩 Claude 3.5 效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。

截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体验。

1.jpg

根据目前最新的用户上手测试,新版 V3 模型前端编码能力的提升,是目前「感知最强」的部分。根据专业用户对新版 V3 的综合体验判断,V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。

用户按照下面的提示词,同时对新版 V3 与 R1 下达任务,实际产出的效果已经出现巨大差异。

创建一个包含 CSS 和 JavaScript 的单个 HTML 文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:风:(例如,移动的云朵、摇曳的树木或风线)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,闪耀的光线、明亮的背景)雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。

左侧是 DeepSeek 新版 V3 模型的生成结果,右侧为 R1 的生成结果。

除了对比 R1 ,用户还用类似的提示词,对比了 Claude 系列。Claude 3.7 作为目前号称「编程能力最强模型」,实际编程能力使用体验也是多次被评为「已经达到专家级程序员水准」。

同一提示词给到 Claude 3.5/3.7 后,除了这个测试案例,根据更多用户对之前 prompt 测试的结果,普遍结论是当前新版 V3 在编码能力已经接近 claude3.7 ,同时也是目前第一时间上手中,大家觉得比之前的 v3 能力提升最大的部分。

针对前端网站搭建测试,新版 V3 所生成的网站(上)在与 Claude 3.7 Sonnet 生成的结果(下)中,也快速「拉齐」了网站的构建效果

除了编程能力,在其他用户的测试中,新版 V3 在多轮对话中体现出了更强的上下文理解能力。

当然,与往常一样,DeepSeek 也没有同时公开表示 R2 或者 V4 模型会在何时发布,但不少用户在体验过新版 V3 后,都觉得似乎 R2 的到来,也已经不远了。

还有一个普通用户「感知不强」,但让开源社区非常兴奋的改变。新版 V3 的开源许可与 R1 一样,也更新变成了 MIT 开源许可(MIT License),这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件。

并且 MIT 开源许可一向以商业友好而著称,使用 MIT 许可的项目可以与商业和专有软件集成,这或许对于希望在商业项目中使用新版 V3 模型的开发者来讲,是本次更新最重要的改变了。

返回列表

上一篇:智启未来生活 AI赋能家电

没有最新的文章了...

相关文章

OpenAI取消GPT-4 Turbo的每日限制!

OpenAI在社交平台宣布,取消了GPT-4Turbo的所有每日限制,并将速率限制提升1倍。现在,每分钟可处理高达150万TPM的数据。OpenAI这一周的连续王炸组合拳,从ChatGPT增加 “记忆...

84%收入来自近1000万名ChatGPT付费用户,机构预计一年创收34亿美元!OpenAI营收拆解!

近日,人工智能(AI)调研机构FutureSearch发布报告,对全球AI独角兽OpenAI的收入构成进行了拆解,提供了一个更清晰的收入结构图。FutureSearch的研究人员称,他们之所以要分析O...

千亿市值归零,ChatGPT 干掉了一家上市公司!

近期,一家美国上市公司好像几乎要被 ChatGPT 搞垮了。自 ChatGPT 发布以来,美国教育科技公司 Chegg 的股价已经暴跌 99%,市值蒸发掉 145 亿美元(约 1050.7 亿元人民币...

推出全新GPT+产品易智汇,易点云与微软AI产品展开全面合作!

  近日,易点云在AI领域迈出了坚实的步伐,携手全球技术巨擘和信诺时代,发布了针对中小企业设计的GPT+产品——“易智汇”。  这款产品不仅将AI技术的强大能力带给了中小企业,还以极具吸引力的价格和服...

是数据不够,还是能力太强?ChatGPT-5为何按下“暂停键”。

是数据不够,还是能力太强?ChatGPT-5为何按下“暂停键”。

关于ChatGPT-5的发布延迟,行业内外的猜测可谓五花八门。人们不仅期待新一代模型的问世,也在揣测它背后的迟滞原因。是数据量不足的技术困局,当前数据量的增长遇到了瓶颈?还是AGI(通用人工智能)的控...

OpenAI把它放到了机器人上,在GPT-4诞生1年后!

ChatGPT拥有了身体,机器人也有了灵魂。从OpenAI在去年3月14日拿出GPT-4后,已经过了整整一年。显然,在GPT-4诞生之后的这一年,一切都迭代得太快了,从GPT-4展现多模态能力,到千行...