2025-05-11 21:48:56 | 来源: AICG工具箱
10月31日报道丨今天下午,在一年一度的 2023 云栖大会现场,阿里云正式发布千亿级参数大模型通义千问大模型。阿里云CTO周靖人宣布,阿里大模型的家族迎来年度最强升级,也宣布通义千问 2.0 版本正式发布。
根据官方特供的信息,在MMLU、C-Eval、GSM8K、HumanEval、MATH等等10个国际主流的大模型Benchmark测评当中,通义千问2.0版本的综合表现超越ChatGPT(GPT-3.5)以及Meta的Llama-2-70B,正在加速追赶GPT-4,与GPT-4的PK里边也是不分伯仲,略逊一筹。
阿里云首席技术官周靖人透露,过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。
英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4.通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念。
在更为本土化的中文任务方面,通义千问2.0版本以明显优势在中文测评C-Eval基准获得了最高分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。
在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5。该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。
在发布新一代通义千问大模型2.0版本的同时,阿里云官方还宣布,基于通义大模型训练的8大行业模型全面上线,它们分别是:
通义灵码-智能编码助手通义智文-AI阅读助手通义听悟-工作学习AI助手通义星尘-个性化角色创作平台通义点金-智能投研助手通义晓蜜-智能客服通义仁心-个人专属健康助手通义法睿-AI法律顾问截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
周靖人提到,通义千问自今年4月首次发布以来,受到社会广泛关注。据介绍,通义千问 2.0 模型参数达到千亿级别,不管是在阅读理解还是逻辑思维、数据等方面,都有大幅度提升,能够全面的达到国际先进水平。
伴随着新版大模型的推出,通义千问 App 也随之发布,支持语音对话等功能,用户开始可以下载相关 App 进行体验。
周靖人指出,阿里云最先提出了“模型即服务”的创新理念,阿里云拥有从大模型底层算力与构筑,到大模型上层应用的拓展落地,再到围绕大模型开展生态建设的全方位立体能力。通过多年的技术积累,阿里云已经搭建了完善 AI 基础设施,建立了完善的 AI 大模型训练平台,能够为大家提供一个非常完善的模型推理服务。
热门榜单
Hi Echo — 网易有道
常用AI美图设计室
常用AIValideo,亚马逊购物助手
常用AIVisual Electric
常用AI千鹿AI
常用AICanva可画
常用AI通义听悟
常用AI即梦AI
常用AI猫箱
常用AI热门资讯
周鸿祎×朱啸虎的创业圆桌会:中国AI大模型反超美国的机会来了,OpenAI很快就会遇到发展瓶颈
04-18商汤全新AI绘图大模型“秒画Artist”v0.3.5版本上手测评:作画水平比肩Midjourney!划重点——免费
12-31有什么方式可以运行stable diffusion_怎么用Docker容器运行 SD
01-24ChatGPT Plus会员怎么付费_如何升级ChatGPT Plus会员
01-26iPhone 16新品将在9月10日发布丨云知声推出「山海」多模态模型丨商汤科技推出「元萝卜」国际象棋AI下棋机器人
02-08中文多模态大模型SuperCLUE-V榜单发布丨Stability AI推出Stable Fast 3D模型丨Meta AI向好莱坞明星采买声音授权
02-11国产最强文生视频模型「可灵」首发:直出2分钟超长视频,生成质量完胜OpenAI Sora丨免费体验
02-25字节跳动发布豆包视频生成模型,这效果让我分不清AI虚拟与现实的边界
12-25首批85个ChatGPT Plus插件全面测评:能打“五星”的插件只有6个
01-07WPS AI表格教程丨Excel办公软件函数公式怎么使用_WPS AI表格公式快速生成!
01-15