2026 年 1 月优必选具身智能大模型 Thinker 评测排名全球第一

图片

在全球具身智能竞赛中,有了新的变量,2026年1月底的时候,中国人形机器人领军企业优必选宣布,正式开源其经过工业产线实战检验的具身智能大模型Thinker的架构升级版,在英伟达、字节跳动等巨头环伺的激烈格局里,这款模型凭借不足百亿的“小体积”,在多项核心评测中取得登顶的成绩,并且已经从实验室演示进入到真实工厂。

权威评测全面领先

图片

就在截至二零二六年一月三十日的当下,依据最新评测数据来说,于基于flageval以及evalscope框架而展开的测评之际,优必选Thinker大模型竟然能够一下子就横扫了空间理解、任务规划等九项核心权威基准,并且综合排名处于全球第一位。而这一成绩的公布之时,恰恰正值全球科技企业都在竞相布局具身智能的关键时期。

评测结果表明,Thinker于Robovqa、Egoplan-bench2等关乎机器人视觉问答以及任务规划的基准测试里,全都获取到了当下最优(SOTA)成果。这般表现不但给它的技术实力给予了客观的支持与证明,还给行业确立了一个新型的性能比照点。

破解产线落地难题

有别于诸多尚在实验室环境当中演示“叠衣服”、上演“分拣物品”的机器人模型,优必选把那搭载Thinker的Walker S2人形机器人布置在了实际生产工厂里。这意味着技术探索朝着规模化应用迈进,其目的是要解决工业自动化里的真实痛点。

一款名为Thinker的设计理念所秉持的哲学着重突出从所谓“刷榜冠军”朝着“产线长工”的这种转变,它直接面对传统视觉语言模型由于依赖互联网第三人称视频数据,进而在机器人第一视角之下所产生的空间定位失准的问题,该模型的核心优化方向是提高在动态且复杂的工业环境里的稳定作业能力。

图片

小参数架构实现高效能

这一个显著特点呈现于Thinker模型,即它有着“小体积大能量”的特性,它不去盲目追求千亿级别的参数量,而是把参数规模控制在100亿以下,它专注于达成毫秒级的实时响应能力,这样精炼的架构让它能够直接部署在机器人本体算力上。

图片

Thinker采用创新的“视频 + 关键帧”联合输入模式,目的在于实现高效能,此模式强化了动作序列末端关键信息的捕捉,能有效避免操作遗漏,且这种设计确保从感知、决策到执行的每一个环节都精准闭环,满足工业级可靠性要求。

数据驱动持续进化

模型具备的强大性能,源自一套呈现系统化特征的数据训练体系。在具身智能领域,存在高质量数据稀缺这一普遍面临的困境情况下,优必选构建了一种全自动流水线,该流水线是从海量原始数据里提炼“黄金数据集”的,并且把人工标注参与率降低到极低水平。

更关键的是,Thinker构建起了一套“数据飞轮”的闭环机制,部署于产线上的机器人,在其作业进程里,不管是成功的案例,还是失败的案例,均能够被自动收集并且回流到训练系统,以此推动模型不断地迭代并优化,这种自我演化的能力确保着它在复杂场景当中的适应性以及鲁棒性。

开源战略赋能产业

图片

这次开源的Thinker架构升级版,被视为优必选深化其“软硬一体”战略的关键行动。公司意在为整个机器人产业供给一个经过工业验证的通用技术基础,降低开发的门槛,加快技术落地的进程。

长久以来,实验室性能跟工业需求相脱节,并且各家企业毫无新意地反复做着同样工作,这成为了行业发展的阻碍。Thinker开源这件事,有希望给全球范围内的开发者,提供统一的开发标准以及工具,借此让他们能够把精力汇聚在解决医疗、物流等垂直领域的特定问题上。

重塑智能定义与生态

思考者的突破以及开源之举,使得行业再度去审视对于机器人“智能”的定义,智能不再单单是流畅的语言交互行为或者精巧的演示表现,而是进一步体现为在嘈杂的、非结构化的真实物理世界里,达成复杂任务时所具备的稳定性以及精准度。

优必选借助开放核心技术这一举措,正试着把中国制造业所拥有的那丰富的、在应用场景方面的优势,转变为可以参与乃至引领全球在技术生态构建方面的,具备主动权这样一种情形。这给具身智能的发展路径,做出了一个预示信号,其发展路径正从那种单一公司所进行的技术竞赛过程,转变为依靠开源协作的产业共同体新型模式。

由您看来,那开源具身这样一项智能大模型的策略,究竟会怎样去改变未来几年之中全球机器人产业的竞争格局,以及创新模式呢?欢迎于评论区分享您所拥有的见解,要是您觉得本文具备价值,请毫不吝啬地进行点赞以及转发。

图片

注册地址:遂宁市政务服务中心3号花瓣4楼3426号
办公地址:遂宁市船山区遂州北路169号6楼‌
联系电话:0825-2317729