2025-04-25 15:22:04 | 来源: AICG工具箱
3月7日报道丨3月6日晚间,李开复旗下的人工智能大模型创业公司“零一万物 01AI”发布消息称,对外开源 Yi-9B 模型,这款大模型的特点是综合数学能力突出,官方称其为 Yi 系列模型中的“理科状元”。
Yi-9B 是目前 Yi 系列模型中代码和数学能力最强的模型,实际参数为 8.8B,默认上下文长度为 4K tokens。
该模型是在 Yi-6B (使用了 3.1T tokens 训练)的基础上,使用了 0.8T tokens 进行继续训练,数据截至 2023 年 6 月。
据介绍,在综合能力方面(Mean-All),Yi-9B 的性能“在尺寸相近的开源模型中最好”,超越了 DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B 和 Gemma-7B。
代码能力方面(Mean-Code),Yi-9B 的性能仅次于 DeepSeek-Coder-7B,超越了 Yi-34B、SOLAR-10.7B、Mistral-7B 和 Gemma-7B。
在数学能力方面(Mean-Math),Yi-9B 的性能仅次于 DeepSeek-Math-7B,超越了 SOLAR-10.7B、Mistral-7B 和 Gemma-7B。
在常识和推理能力方面(Mean-Text),Yi-9B 的性能与 Mistral-7B、SOLAR-10.7B 和 Gemma-7B 不相上下。
官方更声称,Yi-9B(BF 16) 和其量化版 Yi-9B(Int8) 都能在消费级显卡上轻松部署,使用成本较低,开发者友好。
“零一万物”由李开复亲自带队创办,此前已推出 Yi-34B 和 Yi-6B 两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。
热门榜单
万相营造
常用AIFacet
常用AI星火绘镜
常用AI讯飞绘文
常用AILunit,ai癌症筛查工具
常用AICanva AI图像生成
常用AIMagicStudio
常用AIClipDrop
常用AIIconGen
常用AI热门资讯
全网沸腾!AI大模型「开源之王」Llama 3正式发布:性能比肩GPT-4
04-15快手发布文生视频大模型「可灵」丨广东高考首次启用AI智能巡考丨支付宝推出AI毛发自测工具
02-25英伟达CEO黄仁勋:人形机器人将逐渐成为主流,售价将在1万-2万美元之间
04-15波士顿动力最新电驱版Atlas机器人,完美复刻《午夜凶铃》贞子女鬼经典动作
04-15国产AI创业公司Kimi Chat凭200万字上下文窗口「长文本」大火,但前景可能跟淄博相似
04-18ChatGPT年度更新曝光:免费用户升级GPT-4丨华为Pura 70修复「AI消除衣服」BUG丨商汤日日新5.0官网上线
04-14科大讯飞4月26日发布讯飞星火V3.5春季更新丨阿里云全面支持Llama 3训练推理丨腾讯是中国AI发明专利企业最多的企业
04-15金山发布WPS 365办公套件,打造ToB企业全场景一站式AI办公工作流新模式
04-17有什么方式可以运行stable diffusion_怎么用Docker容器运行 SD
01-24MJ怎么批量出图_怎么用MJ批量生图
01-27