首页 > 财经数据 > 财经数据 > LeCun力荐的JEPA杀入LLM,用CV的思路训练LLM,性能鲁棒性双丰收

LeCun力荐的JEPA杀入LLM,用CV的思路训练LLM,性能鲁棒性双丰收

发布时间:2025-09-23 10:08:16

LeCun 这次不是批评 LLM,而是亲自改造。



当前 LLM 的训练(包括预训练、微调和评估)主要依赖于在「输入空间」进行重构与生成,例如预测下一个词。

而在 CV 领域,基于「嵌入空间」的训练目标,如联合嵌入预测架构(JEPA),已被证明远优于在输入空间操作的同类方法。



JEPA 的核心概念最早由 Yann LeCun 及其团队提出,旨在通过在抽象表征空间中预测未来或缺失的特征来高效学习世界知识。随后,Meta AI 团队提出了具体实现,包括 I-JEPA(用于图像、自监督学习、CVPR 2023)和 V-JEPA(用于视频),验证了 JEPA 在视觉表征学习中的有效性。

这就启发了一个新思路:语言模型的训练,能否从视觉领域获得一些启发?

此前,由于设计上的挑战,适用于语言任务的 JEPA 风格模型一直未能出现。主要原因是 LLM 的能力主要通过其生成文本来评判,这是一种输入空间的操作,使得非重构的 JEPA 思想难以直接应用。

为填补这一空白,Hai Huang、Yann LeCun 及 Randall Balestriero 提出了LLM-JEPA。这项工作基于 JEPA 理念,首次将这种高效的自监督学习架构成功地从视觉领域扩展到了 LLM。

该工作通过将(文本、代码)等数据对视为同一概念的多种视图,成功地将 JEPA 目标应用于 LLM,作为标准「文本→代码」等生成任务的有效补充。这既保留了 LLM 强大的生成能力,又引入了 JEPA 在嵌入空间学习高质量表征的优势。

财经数据更多>>

季军奖牌来了,四川男篮胜辽宁夺铜牌,胡金秋一战封神 开车请注意!绿灯不走也违法 “罚款200元、记6分” 嵩县:银杏树下的幸福期许 18岁张展硕夺200米自由泳冠军-潘展乐摘铜 孙杨因抢跳犯规没成绩 微信视频通话藏3个“神仙功能”!90%的人都没用过,实用到哭 离婚证“囍”字惊现!网友:这是民政局在暗示“分完再找下家”? 新管理层到位,金标大众发射第三弹:ID.EVO定名与众08,小鹏深度加持 探索手机 AI 隐私“最优解”:苹果之后,谷歌也入局私有云计算 消息称第二代iPhone Air将重新设计 苹果工程师希望在2027年春季发布 影石和大疆的战争,撕到数据层面了 烧光数十亿,降价超90%,酒店机器人流血狂奔 iPhone Air 或许后继无人,但苹果会永远离经叛道 限时价9.29万元起 第五代瑞虎8上市 车长5米,轴距3米多,环抱式座舱,L2++级辅助驾驶,就等新车了! 爱立信成功完成上行L4S技术测试,助力提升5G实时交互业务体验 网页浏览多1小时!测试表明纯eSIM版iPhone17 Pro续航优势明显 解锁软件许可优化秘籍:5大方法助企业降本30%,同行亲测有效! 首破50%,新能源车月销占比反超燃油车 9投全中+实战扣篮!张子宇全运会完美表现征服赛场 全运会大乌龙!乒乓名将3-1躺地庆祝,裁判突然喊:比赛还没结束 泳池新王诞生!18岁战胜孙杨,他的谦逊让全网点赞 从七元涨到40元,一天一个价 广州地标建筑“铜钱大厦”挂拍15天无人报名,管理人回应:若无人报名,将进行第二次挂拍 刷新亚洲纪录!13岁“小孩姐”于子迪摘金! 广州楼市“掀桌子”!明年起,你买的新房全是“拼装预制”! 巅峰对决!“地表最难乒乓球赛”开始了 荣耀 500 系列手机全系搭载骁龙 8 系芯片、全面支持幻影引擎 3.0 京东线下自营大店双11同步新开15家店 AI浪潮下,我们的工作真会被取代吗? “六小龙”首次齐聚乌镇 他们都谈了些什么?记者探访