|

南极财经网
2000活跃值=1元

首页 > 财经数据 > 财经数据 > LeCun力荐的JEPA杀入LLM，用CV的思路训练LLM，性能鲁棒性双丰收

LeCun力荐的JEPA杀入LLM，用CV的思路训练LLM，性能鲁棒性双丰收

发布时间：2025-09-23 10:08:16

LeCun 这次不是批评 LLM，而是亲自改造。

LeCun力荐的JEPA杀入LLM，用CV的思路训练LLM，性能鲁棒性双丰收

当前 LLM 的训练（包括预训练、微调和评估）主要依赖于在「输入空间」进行重构与生成，例如预测下一个词。

而在 CV 领域，基于「嵌入空间」的训练目标，如联合嵌入预测架构（JEPA），已被证明远优于在输入空间操作的同类方法。

LeCun力荐的JEPA杀入LLM，用CV的思路训练LLM，性能鲁棒性双丰收

JEPA 的核心概念最早由 Yann LeCun 及其团队提出，旨在通过在抽象表征空间中预测未来或缺失的特征来高效学习世界知识。随后，Meta AI 团队提出了具体实现，包括 I-JEPA（用于图像、自监督学习、CVPR 2023）和 V-JEPA（用于视频），验证了 JEPA 在视觉表征学习中的有效性。

这就启发了一个新思路：语言模型的训练，能否从视觉领域获得一些启发？

此前，由于设计上的挑战，适用于语言任务的 JEPA 风格模型一直未能出现。主要原因是 LLM 的能力主要通过其生成文本来评判，这是一种输入空间的操作，使得非重构的 JEPA 思想难以直接应用。

为填补这一空白，Hai Huang、Yann LeCun 及 Randall Balestriero 提出了LLM-JEPA。这项工作基于 JEPA 理念，首次将这种高效的自监督学习架构成功地从视觉领域扩展到了 LLM。

该工作通过将（文本、代码）等数据对视为同一概念的多种视图，成功地将 JEPA 目标应用于 LLM，作为标准「文本→代码」等生成任务的有效补充。这既保留了 LLM 强大的生成能力，又引入了 JEPA 在嵌入空间学习高质量表征的优势。

LeCun力荐的JEPA杀入LLM，用CV的思路训练LLM，性能鲁棒性双丰收

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“南极财经网用户上传并发布"，本平台仅提供信息存储服务。

下一篇:华为引领算力创新国产算力迎机遇

上一篇:多家快递企业调整收件价格

财经数据更多>>

智能体手机，抢跑 2026 的「方法论」 “恐怖数据”驾到黄金、美元指数、日元、欧元、英镑、澳元和人民币技术前景分析东鹏特饮A+H股双上市、TikTokShop强化风控、X投票改进新款小米SU7续航曝光：三种电池版本，CLTC最高902km 2025年陕西省级人才计划拟入选名单公示 Seedance2.0引爆应用端，还有哪些方向值得重视？周二收盘点评渭滨50万元电子消费券正式开抢！满500减100、满200减50...... W4周排名出炉，苹果、华为位置互换，小米、荣耀位置也互换涨价潮下的“生存游戏”：谁能率先穿越周期？ 4年前机型将喜提ColorOS 16正式版：还能再战曦望联席CEO王勇：启望S3研发完成，年中流片年底回片量产商汤开源多模态自主推理模型SenseNova-MARS 字节、阿里、腾讯 AI 大战全记录：一场影响命运的战争微信内公众号图标变了：从“一页”变成了“两页” 中国互联网大厂的 AI 时代船票争夺战已经开始了字节扣子 2.0 发布，我们深挖了它这两年的生长真相短剧红利狂欢下：屏幕里手握数亿元的“霸总”，屏幕外追要万元欠薪？泰山啤酒重整：鲜啤王牌，何以渡劫？ 2025年新建商品房销售额83937亿元厂商称被冒名代工名创优品围巾？名创优品暂无回应五菱大SUV卖6.28万，配1.5T+四轮独悬，轴距超2米8，又要火了！解锁任意步数文生图，港大&Adobe全新Self-E框架学会自我评估日产大5座SUV，NX8实车现身，车长4870mm，两种动力，上半年上市买车等等！比亚迪26年有超13台新车值得等：汉唐9系叫啥合适？比黄金还猛！白银价格飙升150%，三个被忽视的原因非常重要长城证券汪毅：2026年看好AI应用领域科技有AI，连接全球：海信家电参展CES 2026，定义智慧生活新图景拼多多内测“百亿超市”，低价再拓新场景真我 Neo8 参数曝光，骁龙 8 Gen5 、8000mAh电池 2026年第一款真全面屏来了！红魔11 Air官宣

Copyright 2007-2025 南极财经网版权所有京ICP备2023037816号-12