2025-04-15 17:25:21 | 来源: AICG工具箱
千呼万唤!全球AI大模型开发者翘首以盼的——Llama 3,来啦!
北京时间今天凌晨,硅谷AI大厂Meta官网上新,官宣Llama 3正式发布。
这波发布,提供80亿和700亿参数两个版本。
有意思的是,80亿版本在某些测评项目的成绩上还超过了70亿版本。
Meta同时宣布,Llama 3继续走开源大模型路线,人人可耍。
官方数据显示,Llama 3 8B和70B版本在同量级的较量当中,均超越了一众对手。
可以这么总结:MetaLlama 3重新夺回开源大模型之王的宝座!
80亿参数版本在MMLU、GPQA、HumanEval等多项基准上均胜过谷歌的Gamma 7B和欧洲公司开发的Mistral 7B Instruct。
而700亿参数版本甚至超越了今年初红极一时的Claude 3 Sonnet,也与谷歌费尽九牛二虎才整出来的Gemini Pro 1.5打得有来有回。
Meta很快就将新模式上线到Hugging Face开源社区提供试玩。
眼尖的网友还发现了更多惊喜!Meta留了一手,4000亿参数的Llama 3 400B+版本,据称能够媲美Claude 3Opus「超大杯」!
开源大模型,已经完全能够企及闭源大模型,就在2024年上半年。
一位AI写作工具的CEO不禁感慨:我们正在步入一个新世界,一个「GPT-4量级」的开源模型可以自由访问的世界。
英伟达科学家Jim Fan则认为,还未开源的Llama 3 400B+将成为开源大模型的新标杆,并且改变很多学界研究和AI初创公司的发展方向。
用现在流行的话说,那就是:开源Llama 3,源神”启动!
Llama 3将加速开源模型世界快速建立自己的护城河,类似于今天手机上的安卓系统应用生态。
据了解,在模型训练方面,Meta一口气用上2.4万块英伟达H100 GPU组成的算力集群。
Llama 3的的训练数据集多达15T Tokens,宣称都是来自开源世界,其中95%为英文素材,其他5%涵盖了30多种语言,也包括中文。
Llama 3训练的数据量比Llama 2多了7倍。
对于新发布的模型,MetaCEO扎克伯格表示:“我们的目标不仅仅是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。”
xAI公司的CEO马斯克评价:Not bad。——但我更关心,你俩还决斗吗?
因此,无论是8B版本还是70B版本,Llama 3的性能都远超Llama 2.
在语言(MMLU)、百科(GPQA)、编程(HumanEval)、数学(GSM-8K、MATH)等能力上,Llama 3无一例外全面战胜竞争对手。
除了常规的测试课题,Meta还评估了Llama 3在现实世界理解的性能,并为此独立研发了一套高质量的测试集。
这份测试集是另外一拨人整理的,包含1800条测试数据,涵盖编程、推理、写作、文本总结等12种实践用例,并对大模型的开发团队完全保密。
测试结果显示,Llama 3不仅完爆Llama 2.也战胜了Claude 3 Sonnet、Mistral Medium和GPT-3.5等业内闻名的模型。
但美中不足的是,Llama 3的上下文窗口吞吐只有区区的8K,这与今年流行的「长文本」大模型标杆来说,还停在了去年的水平。
不过也不用为此担忧,在开源社区的开发者共同努力下,相信上下文的文本量很快就会涨上去。
作为一款开源大模型,在过去,Llama一直是没有我们熟悉的AI在线聊天对话机器人。
目前,Llama 3的两种参数版本均已在Hugging Face上线,在线可玩。
此外,Llama3也会登录微软Azure、谷歌云、亚马逊AWS、英伟达NIM等云服务平台。
AI芯片厂们——英特尔、英伟达、AMD、高通等都第一时间宣布支持Llama 3在本地运行。
但这还不够,Meta终于以「Meta AI」的名字,推出了基于Llama 3的官方网页聊天工具。
目前该平台提供AI对话和AI绘画两大功能,且无需登录。
不过,目前这套AI系统对中文的支持依然很差,也不支持在线文档解读与总结。
据我们实测后发现,Meta方面甚至设置了汉化翻译的安全护栏,不愿向用户提供服务。
代码方面,该平台能运行一些简单的Python程序,但无法实现程序绘图。
总的来看,「Meta AI」的网页版本功能性上还比较初级,有待后续更新。
想测试新模型的性能的家人们,可以复制下方的地址体验:
https://www.meta.ai/
热门榜单
美图设计室
常用AI通义万相
常用AI剪映
常用AIEmo-阿里巴巴的AI视频生成框架
常用AI美图AI文生图
常用AICanva AI图像生成
常用AIRibbet.ai
常用AI万相营造
常用AIARC
常用AI热门资讯
B端设计教学_怎么进行UI视觉设计_B端设计教学
01-16阿里云发布通义千问2.5大模型:号称多项能力赶超GPT-4,发布开源模型Qwen1.5-110B
04-09MJ怎么批量出图_怎么用MJ批量生图
01-27中文多模态大模型SuperCLUE-V榜单发布丨Stability AI推出Stable Fast 3D模型丨Meta AI向好莱坞明星采买声音授权
02-11商汤全新AI绘图大模型“秒画Artist”v0.3.5版本上手测评:作画水平比肩Midjourney!划重点——免费
12-31Sora 平替:AI视频工具 Haiper免费来袭|零基础应用教程
01-09stable diffusion初识_stable diffusion跟其他工具有什么区别]
01-17荣耀CEO赵明:荣耀领先三年,很高兴看到苹果追随我们的AI手机发展路线
02-24小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
02-24OpenAI今夜发布新版GPT-4大模型:“青春版”GPT4-Lite现身,AI搜索引擎「SearchGPT」代码首曝光
04-03