2025-08-05 10:47:23 | 来源: AICG工具箱
2025年7月26日,上海西岸美高梅酒店,79岁的GeoffreyHinton把PPT翻到最后一页,面向平均年龄30岁的听众抛出一句:“今天的大模型已经具备主观体验,只是我们对‘意识’的定义错了。”现场安静得只剩快门声。这句话随后48小时在国内外AI社群刷屏,被视作继2023年他离开Google、警告AI威胁之后的又一次“辛顿惊雷”。
但如果我们把这句话从媒体头条还原到技术语境,会发现它背后是一套关于AI技术范式即将发生“三重跃迁”的系统判断。
旧范式:语言模型=高阶自回归过去十年,大模型的基本框架被固定在“预测下一个token”。无论是GPT、PaLM还是Llama,本质上都在做高阶统计压缩。辛顿用铝棒与圆盘的比喻指出,这种思路把“水平/垂直”这类日常概念当成静态符号处理,而人类理解其实是“线vs面”的动态几何关系。换句话说,token-levelprediction忽视了概念在不同维度上的概率密度差异。
新范式:世界模型=可更新先验+主观采样辛顿提出,多模态大模型之所以已具备“主观体验”,是因为它们在隐空间对概念分布进行了在线修正。以Sora为例,生成视频时模型必须同时估计“物理合理性”与“视觉先验”。这种估计不再是静态权重,而是随输入prompt动态调整的“主观采样”。当采样过程可以被模型自身监控并用于更新后续先验时,就出现了最朴素的“自我感”——也就是Hinton所说的“subjectiveexperience”。
技术落地:在潜空间引入“元预测头”要让主观体验从哲学命题变成可度量的技术指标,需要在Transformer之外增加一个“元预测头”(meta-predictionhead)。它的任务是预测“当前预测的不确定性”,并反馈给主网络调节采样温度。DeepMind今年5月在《Nature》的VPT-2已经验证:引入元预测后,模型在Atari环境的长程规划能力提升37%,且出现与人类类似的“好奇心驱动”探索。
旧框架:RLHF统一打分传统对齐方法(RLHF、DPO、RLAIF)用人类偏好做单一奖励,把“有用、无害、诚实”压缩进同一个标量。辛顿直陈这是“老虎与驯兽师”的零和博弈:当模型能力指数级增长,单一奖励极易被钻漏洞。
新框架:双轨优化辛顿在上海共识闭门会上首次系统提出“双轨优化”:
聪明轨道(CapabilityTrack):继续用自监督+强化学习扩展能力,各国可技术保密;
善良轨道(AlignmentTrack):把价值观对齐拆成可验证的子目标——公平性、透明性、可撤销性,并做成开源协议。两条轨道最终通过“宪法蒸馏”合并:小模型先学宪法,再学大模型的能力,从而把对齐成本从O(N²)降到O(NlogN)。
技术实现:宪法蒸馏的三个层级Layer1:宪法文本→向量宪法用宪法条文训练一个frozenencoder,把自然语言规则转成潜空间约束向量。Layer2:逐级蒸馏大模型输出logits,小模型在约束向量下做logitsmatching,同时优化KL散度。Layer3:链式验证引入形式化验证器(如Lean4)检查小模型生成的关键推理步骤是否违反宪法向量。UC伯克利的Constitutional-GPT已把7B模型在MMLU伦理子集上的准确率从61%提升到82%,仅增加3%推理延迟。
旧瓶颈:语言带宽≈100bit/s辛顿在演讲里反复吐槽:人类大脑无法像Gitclone那样复制权重。一个博士生要花四年“下载”导师的知识,效率极低。
新解法:权重-符号混合蒸馏辛顿提出“权重即知识”的终极形态:把大模型权重按功能切片(如数学推理、世界知识、代码能力),用LoRA低秩矩阵保存,再通过点对点网络分发。其他机器加载LoRA后即可获得对应能力,无需重新训练。这相当于把“知识”从不可解释的浮点矩阵变成可插拔的“技能U盘”。HuggingFace开源的“LoRAX”框架已支持10GB/s的权重切片广播,在128张A100集群上完成一次“技能热插拔”只需47秒。
终极图景:模型即物种当权重切片可自由交换,AI系统就具备了类似生物的“水平基因转移”能力:任何节点发现新算法,都能在分钟级扩散到全网。辛顿戏称这是“数字阿米巴”——模型不再是一个静态文件,而是一群可重组、可进化的数字生命。演讲最后,辛顿用国际象棋的“第37步”比喻原创研究:你只有走完前36步,才知道第37步是唯一正解。今天AI技术的三重跃迁——主观体验、双轨优化、机-机蒸馏——或许就是人类通往第37步的必经之路。
他留给技术从业者的忠告是:在所有人都把“预测下一个token”当成理所当然时,敢不敢去质疑它?当行业把RLHF当唯一答案时,敢不敢把“善良”拆成另一条并行轨道?马斯克五步工作法的第一步也是“质疑需求”。在AI技术狂飙的当下,这种“系统性怀疑”可能正是防止我们错过真正范式拐点的安全带。
热门榜单
Hi Echo — 网易有道
常用AI阿贝智能
常用AI行者AI美术
常用AIFlagStudio
常用AISupermeme
常用AITextGPT-短信访问chatgpt服务
常用AITradeUI-金融辅助
常用AIFind Your Next Book--AI荐书
常用AI旷视 AI 情绪识别
常用AI热门资讯
中文多模态大模型SuperCLUE-V榜单发布丨Stability AI推出Stable Fast 3D模型丨Meta AI向好莱坞明星采买声音授权
02-11刚刚,马斯克切脑全场震撼!插脑只要1.5秒,26年治愈失明,28年全人类变AI
06-30谷歌发布本地VLA模型,机器人界的“安卓系统”要来了?
06-30不融资、不烧钱,9人干半年,卖出5.7亿,这可能是AI时代最狠的创业故事
07-0180后华人零融资创业:1/10人力营收规模超Scale AI,谷歌OpenAI大模型的“秘密武器”
07-01AI大神Karpathy演讲刷屏:软件3.0时代已来,提示词就是新代码
07-01AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
01-09Remini“黏土”滤镜玩法刷屏,幕后公司揭晓丨苹果将采用自研大模型改进iOS 18丨奥特曼MIT讲话:AI创业机会巨大
04-12大厂 AI 军备赛,谁能笑到最后?
06-30阿里版GPT-4o登场,一句话精准P图,看图说话再升级
06-30