性能全面赶超GPT-4 Turbo,阿里云发布通义千问2.5!

seekdeep1年前AI资讯406

阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。




相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此出色的成绩。




通义还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。




通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。


通义大模型问世一年多来,还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。


相关文章

中美两国AI已走出分岔,ChatGPT两周年!

2年前的2022年12月1日凌晨2点02分,下一代AI浪潮的命运之子ChatGPT正式上线。这标志着AI行业的一次新生。当时,OpenAI CEO奥尔特曼(Sam Altman)发布推文称,“语言界面...

陷史上最大公关危机,Altman 捐出一半身家帮公司度难关。OpenAI 公布“ GPT-6 ”最新进展!

OpenAI 可能遇到了成立以来最大的公关危机!而 Sam Altman 的应对速度之快,效果之好,绝对值得所有公司老板和公关人逐帧学习。我们先看 OpenAI 最新的动作——官推 5 月 28 日突...

GPT-5红队测试邮件曝光,数十亿美元超算26年启动。

陆续有网友晒出OpenAI发给自己的红队邀请邮件,看起来,GPT-5已经进入红队测试了?网友们纷纷展开畅想,对Sam Altman在线「催更」。另有消息曝出,OpenAI的一个mini版数十亿「星际之...

AI时代下普通人如何抓住机遇? 蚂蚁集团布局人形机器人!

蚂蚁集团近日在上海浦东成立蚂蚁灵波科技有限公司,专注于人形机器人和具身智能技术的研发与应用。这一消息引发了外界对AI技术未来发展的广泛关注。具身智能作为人工智能与机器人学的前沿交叉领域,强调智能体通过...

物化生水平比肩人类博士,OpenAI发布o1推理模型,碾压GPT-4o!

对于复杂的推理任务来说,o1 代表了当前人工智能(AI)能力的新水平。就在刚刚,OpenAI 的“草莓”模型正式发布,名为“o1”,这是一系列新的人工智能模型,旨在花更多时间思考后再做出回答。与以前的...

 LNM-DecisionGPTG决策超脑™通过中央网信办审核!

LNM-DecisionGPTG决策超脑™通过中央网信办审核!

2024年11月1日,中央网信办经过严格审核,正式通过并发布了未来地图100%自主知识产权LNM-DecisionGPTG决策超脑™大数值模型算法备案,者意味着完整的LNM底座模型之母被国家认可,而且...