2025-08-09 07:02:48 | 来源: AICG工具箱
8月6日消息,科技媒体webpronews昨日(8月5日)发布博文,报道称谷歌DeepMind于8月5~7日在Kaggle的GameArena平台上,举办“AI国际象棋”比赛,邀请OpenAI、Anthropic、谷歌、Kimi、Deepseek在内的顶尖模型一较高下。
DeepMind表示,本次“AI国际象棋”比赛的目的,是检验顶级AI模型的推理能力。本次活动将于8月5~7日举行,每日举办一轮比赛,由国际象棋大师HikaruNakamura和流媒体播主LevyRozman解说。
在AI发展的重要时刻,这场象棋对决提供了一个严格的测试,以评估AI的预见和策略调整能力,文本基础的格式解决了许多大型语言模型在视觉象棋盘表示上的难题,提供了一个更公平的推理能力测试。
附上本次参赛选手如下:
Gemini2.5Pro(Google)
Gemini2.5Flash(Google)
o3(OpenAI)
o4-mini(OpenAI)
Claude4Opus(Anthropic)
Grok4(xAI)
DeepSeekR1
Kimik2(MoonshotAI)
根据首日战况,OpenAI的o4mini胜过Deepseek-R1、OpenAI的o3超过KimiK2Instruct模型、谷歌的Gemini2.5Pro胜过ClaudeOpus4、xAI的Grok4模型超过谷歌的Gemini2.5Flash。
热门榜单
阿贝智能
常用AI行者AI美术
常用AIFlagStudio
常用AITextGPT-短信访问chatgpt服务
常用AITradeUI-金融辅助
常用AIFind Your Next Book--AI荐书
常用AI旷视 AI 情绪识别
常用AI万相营造
常用AIDeepSwapper
常用AI热门资讯
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
01-0880后华人零融资创业:1/10人力营收规模超Scale AI,谷歌OpenAI大模型的“秘密武器”
07-01AI 思维导图:boardmix AI 一款All-in-one的在线白板软件,助力高效远程办公!
05-29OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
07-01首位“纯血”AI艺人诞生,虚拟偶像迎来分水岭?
07-01AI专业再成热门:这一批少年,将亲身验证这个时代的算法
07-01人形机器人泡沫破裂?独角兽达闼停摆,硅谷明星 Figure 陷“造假”风波
07-07“擦边”营销、诱导消费,赛博恋爱是门好生意吗?
07-13马斯克Grok AI大模型首发测评:这个AI机器人的嘴碎水平和幽默水平跟他本人一模一样
12-30百度网盘修图是什么_百度网盘AI修图是什么_百度网盘怎么修图_百度网盘修图使用方法
01-06