2025-06-07 11:37:21 | 来源: AICG工具箱
6月9日报道 | 6月9日的智源大会上推出悟道·天鹰与天秤FlagEval,推动了大模型在产业落地和技术创新,智源研究院发布了首个支持中英双语知识开源商用许可的大模型与首创”能力-任务-指标”三维测评的平台这两大重磅产品。
“悟道·天鹰”Aquila模型系列中包含具备中英双语知识、支持商用许可协议、支持国内数据合规要求的开源语言大模型。悟道·天鹰(Aquila)系列模型包括 Aquila基础模型(7B、33B),AquilaChat对话模型(7B、33B)以及 AquilaCode “文本-代码”生成模型。
开源地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila
大会上强调了AquilaChat对话模型四个技能:
智能对话智源研究院副院长兼总工程师林咏华告诉媒体,一个消费级显卡就能运行Aquila-7B模型:如果是FP16精度,Aquila-7B模型可以在20GB显存的显卡上运作起来,换成低精度的模型,则可以用更小的显存。
“我们的发布只是一个起点。”她说道,智源今天打造了一整套“大模型进化流水线”,基于此,智源会让大模型在更多数据、更多能力的增加之下,源源不断地成长。
智源研究院首创“可持续、自动化评测辅助模型训练”的新范式,将大模型训练与评测结合,利用阶段性的自动化评测结果,指导后续训练的方向、选择更优路径,大幅提升模型训练的效果,实现了“大模型进化流水线”,悟道 · 天鹰Aquila语言大模型系列后续也将持续迭代、持续开源。
FlagEval(天秤)大语言模型评测体系及开放平台
目前,传统评测方法已经远远无法满足大模型评测的需求。因此,打造一套“自动化评测+人工主观评测”的大模型全面评价系统,已是基础大模型创新的重要壁垒之一。
智源推出的天秤(FlagEval)大模型评测体系及开放平台,协助相关研究人员全方位评估基础模型及训练算法的性能,同时探索利用AI方法实现对主观评测的辅助,大幅提升评测的效率和客观性。
FlagEval构建了“能力-任务-指标”三维评测框架,深度测试基础模型的认知能力边界颗粒,并可视化呈现评测结果。
同时FlagEval开放评测平台现已开放,支持英伟达、寒武纪、昆仑芯、等多种芯片评测,以及PyTorch、MindSpore以及多种深度学习框架。
测试平台链接:http://flageval.baai.ac.cn
作为打造中国A人工智能三步走战略重要的一环节,天秤FlagEval评测体系与多所大学联合定期发布权威评测榜单。期待国家在语言、视觉,多模态大模型上继续突破。
热门榜单
小冰岛
常用AIDALL·E 3
常用AIPika AI
常用AI猫箱
常用AIWink Studio
常用AI夸克扫描王
常用AI博思白板 — boardmix AI
常用AISDXL Turbo — Clipdrop
常用AIVideoPoet
常用AI热门资讯
TensorRT插件安装_TensorRT插件怎么提升SD生图速度_stable diffusion插件
05-08神州问学深入大模型微调技术研究,小参数的模型在特定任务场景中表现超越大模型
01-31DeepL推出新一代翻译编辑大模型:翻译质量超越竞争对手谷歌微软ChatGPT
02-13落地发绿卡?微软加速AI团队撤出中国,加码布局投资东南亚市场
03-27微软Build 2024发布Copilot多项服务升级丨通义主力大模型API定价暴降97%丨文心大模型两大主力模型API免费
03-27vivo发布行业首个视障人士辅助多模态大模型,AI智能识别物体,为视障人士开启智能“电子眼睛”
03-28谷歌Gemini文生图翻大车:生成人像过度追求种族多元性,涉嫌“歧视白人”,这可能是马斯克被“黑”得最惨的一次
04-26三星新一代旗舰手机Galaxy S24遭到沃尔玛「意外」提前上架:主打AI翻译功能,搭载高通骁龙8 Gen 3处理器
05-03开源版Gemini诞生_全能多模态模型Emu2登热榜_最新Emu2
05-03「微信AI」功能终于要来了:腾讯官宣2024微信公开课PRO定于1月11日开讲,还携手OPPO战略合作
05-03