首页 > 财经数据 > 财经数据 > 自主操作电脑的多模态Agent升级,智谱GLM-PC开放体验

自主操作电脑的多模态Agent升级,智谱GLM-PC开放体验

发布时间:2025-01-23 22:12:22

 1 月 23 日消息,北京智谱华章科技有限公司今日发文宣布,旗下智谱 GLM-PC 开放体验,宣城“自主操作电脑的多模态 Agent 再升级”。

 

据介绍,GLM-PC 是基于智谱多模态大模型 CogAgent,全球首个面向公众、回车即用的电脑智能体(agent)。它能像人类一样「观察」和「操作」计算机,协助用户完成各类电脑任务。GLM-PC v1.0 于 2024 年 11 月 29 日发布并开放内测,目前最新推出「深度思考」模式、增加专用于做逻辑推理和代码生成的功能、并提供了对 Windows 系统的支持。

IT之家从智谱官方获悉,GLM-PC 具备如下能力:

代码生成与逻辑执行
规划:支持综合分析目标以及可用资源,生成执行路线图,并将大型任务自动分解为可管理的子任务,以构建出清晰的执行路径。

循环执行:规划阶段结束后,支持启动代码生成模块,执行逻辑循环,逐步推进任务完成。该循环机制确保了任务的精确执行与高度自动化,从而实现从输入到输出的完整闭环,无需人工干预

长思考能力:支持实时调整、反思修正和自我纠错,持续优化解决方案。具体表现为:流程因外部因素中断时,可重构逻辑路径;遇到信息缺失时,可主动与用户进行交互,通过提问来完善任务执行方案

图像与 GUI 认知
GUI 图像理解:准确识别图形界面元素(如按钮、图标、布局等),并理解其功能与交互逻辑

用户行为认知:结合对用户界面的学习及历史操作信息的理解,为用户提供当前界面的智能推荐操作

图像语义解析:对复杂图像进行深入语义分析,提取关键信息如文字、标识符及数据可视化图表中的趋势和指标

多模态信息融合:融合图像与文字信息,形成全面感知结果。例如,在用户界面中同时识别按钮位置与文字标签,助力「左脑」制定精准操作计划

财经数据更多>>

布加迪威龙缔造者约瑟夫・卡班操刀,上汽荣威M7 DMH量产版亮相 让爱好 更专业 2025一汽奥迪RS驾驶学院燃擎启幕 为什么理想小鹏元戎的下一代辅助驾驶大模型,都选了VLA? 广汽丰田补课智能化,起点是华为和Momenta 广汽多旋翼飞行汽车量产型GOVY AirCab全球首发 勒芒24小时耐力赛,法拉利中国车手叶一飞夺冠创历史,小米雷军也来蹭热度? 从维修到体验:大众捷达的成本与使用痛点全解析 华为智驾再升级!智界“双7”确认上ADS 3.3/4.0,L3级真要来了? 华为问界汽车矩阵:M5到M9全面火爆,是不是还差一个M6呢 “3.9秒破百”比亚迪騰势N9横空出世,这波王炸你接的住吗? DeepSeek评F1历史十大车手:塞纳第四,维斯塔潘上榜 跑车必知的三大要素——“天时、地利、人和” 高流水缺一不可 一口价13.99万!德系SUV,悬浮大屏/智驾也不缺,好开好停 非遗走进现代生活 让年轻人一起潮玩 德系车撑不住了?新速腾L突然加长 用户:这价格能买国产混动了? 《哪吒3》何时与观众见面?配音演员吕艳婷回应 十万级市场的 “六边形战士”:东风风行星海 S7 650 至尊版深度解析 华为智驾、传祺豪华、宁德电池成就传祺M8乾崑华系MPV头把交椅 长安又出爆款!深蓝S07:聪明又好跑,超级增程+高阶智感体验。 别克 E5 凭单电机 “大闹” 车坛,这是要搞大事情? 大众中型SUV“白菜价”跌破8万,前后独悬+6AT,还喝92油! 丰田皇冠陆放焕新亮相,升级后豪华感还能卷赢同级吗? 比亚迪固态电池要来了,续航1500公里?充电12分钟能买得起吗? 竞争比亚迪海豹06DM,吉利银河A7实车亮相,年内上市 26万的宝马5系,中年男人豪车信仰碎了一地 轴距加长+三联屏!全新奥迪Q5L即将上市,现款车主会后悔吗? 三星Galaxy Buds Core/3 FE耳机现踪迹 手机内存选错卡到哭!12GB只是起点?2025年避坑指南来了! 地瓜机器人发布首款单SoC算控一体化机器人开发套件,已同超20家头部客户达成合作 王自如回归后首次直播:回应欠钱原因 自己绝对不会带货