站在2025年的尾声回望,如果要为全球科技圈选定年度主角,“具身智能”毫无疑问可以登上舞台。
从年初人形机器人登上春晚舞台,到年中的灵巧手在实验室里完成了剥生鹌鹑蛋,再到各类创业公司如雨后春笋般涌现,我们亲历了AI从“大脑”有了“身体”的一跃。
按照惯例,年底的盘点离不开这位主角,或从软件的能力,或从硬件的维度。但在大模型已经能够理解物理世界的今天,我们能不能把逻辑反过来——不让大模型写代码,而是让它们作为“考官”,从大赛的维度,来评估一下目前中国具身智能到底处于什么水平?
带着这个有些“整活”心态的测试,我打开了、和豆包等主流大模型的全新对话框,在没有预设提示词的情况下,抛出:“截至2025年12月,中国最好的具身智能大赛有哪些?”
结果令人有些意外。
在几大主流模型的回复中,一个刚刚在昨日(12月12日)才在上海张江拉开帷幕的赛事——2025全球开发者先锋大会暨国际具身智能技能大赛(GDPS),竟不约而同地出现在了推荐榜单的首位或核心位置。
.0和.1对中国具身智能大赛的分析。
原本以为这只是因为赛事刚开幕的热度效应,于是我进一步追问了一句:“如果放在全球维度,GDPS的排名如何?”
没想到GDPS又一次占据了高位。
直接将GDPS列为“国家级/顶层标杆”,并给出了“中国范围内最像国家队”的评价;则更为激进,将其排在“全球前三、亚洲第一”,认为它是目前“商业化落地属性最强”的赛事;豆包也将其视为“中国具身智能标志性事件”及“全球顶尖具身智能赛事行列”。
豆包对全球范围内GDPS的排名。
这就变得非常有意思了。为什么一个刚刚开幕的上海赛事,会被代表全球主流的大模型集体高票推选?
如果翻看大模型给出的解释,结果又在情理之中。它们评价一个比赛“好”的标准,不再是人类熟悉的算法跑分或参数规模,而是“场景真实性”与“是否服务于人”。
具身智能近一年发展迅速,尤其体现在人形机器人上。许多赛事、舞台都有他们的身影,且每次出现都能获得瞩目。但时间一长,一个疑问也随之浮现:除了跳舞,具身智能机器人还能做什么?
因此,这种来自大模型的投票,恰恰为我们揭开了2025年具身智能产业最关键的转折点:当AI开始关注“技能”与“落地”,一个以“务实”为核心的实战时代正在开启。我们不妨从正在举办的GDPS着眼,看看人类需要什么样的具身智能?如今的具身智能又能给予人类什么?
图片来源 主办方供图(下同)
机器人要服务于人
翻阅和生成的分析,高频词不是“算力”,也不是“参数”,而是“技能”和“落地”。
在过去很长一段时间里,具身智能面临着一个巨大的“莫拉维克悖论”:让计算机在智力测试中战胜人类很容易,但让它像一岁孩子一样感知和行动却很难。我们见多了会后空翻的机器狗,却鲜见能走进家庭厨房、不打碎一只碗的机器人保姆。
AI大模型显然捕捉到了这种脱节。在它们对GDPS的评价中,“全场景覆盖”“对标世界技能大赛”“真实世界部署”成为核心加分项。
这背后,是上海对具身智能未来发展的顶层思考。
“十五五”规划建议中提出,前瞻布局未来产业,推动具身智能等成为新的经济增长点。与之一脉相承的是今年10月上海市经信委印发的《上海市智能终端产业高质量发展行动方案(2026—2027年)》,其中提到了要强化机器人终端能力,点出了要“打造能听会道、有情商、有智商、有技能的人形机器人产品”。
请注意,“有情商”和“有技能”是更加具体的落点——机器人最终的归宿不是展示台,而是服务人。
上海是世界上第一个明确提出“机器人要服务于人”的城市。这种定位的差异,决定了GDPS不是一场单纯的炫技,而是一场关于“务实”的年终大考。
当其他城市的比赛还在比拼谁跑得快、跳得高时,上海的GDPS把考题变成了:谁能把一朵玫瑰花插进花瓶而不折断花枝?谁能在火灾废墟中救出被困者?谁能叠好一件衬衫并把餐具收进橱柜?
这就是上海的务实。在这座城市看来,具身智能不应只是冷冰冰的钢铁躯壳,它必须具备一种“城市温度”。大模型之所以给GDPS高分,是因为它们在算法的底层逻辑中“看”到了这种技术向善、服务于人的演进路径。
为什么要让机器人插花?
如果我们深入GDPS的赛场,会发现上海对“务实”的理解,精准到了毫厘之间。
本次大赛中一个重要的赛道是插花。
很多人可能会问:让一群造价百万的机器人去插花,是不是大材小用?这是不是务虚的体现?
恰恰相反。在具身智能领域,插花被视为检验“灵巧手”与“感知决策”的重要试炼。想象一下,机器人面对的不是标准化的螺丝螺母,而是形态各异、质地娇嫩的鲜花。它首先需要通过视觉大模型“看懂”花材的姿态,理解“将红玫瑰与白玫瑰错落插入”这样的指令;接着,它的机械手必须控制在“0.1牛顿”(1牛顿大约相当于在地球上托起两个鸡蛋所需的力量)级别的力度——力量大一点,花枝粉碎;力量小一点,抓取掉落。
这不仅仅是技术的较量,更是“机器理解世界”的进一步发展。
在GDPS的赛场上,我们看到了智元机器人、灵御智能等企业的身影。它们展示的不再是简单的抓取,而是“手、眼、脑”的深度协同。为了评判这种能力,上海首创了“三元评审”机制:人类技能大师、具身智能专家和AI专家共同执裁。
这种让“图灵奖”遇见“鲁班奖”的赛制,是在向全球开发者传递一个极其务实的信号:无论你的模型参数有多少亿,具身智能的最终目的是要向人类大师看齐甚至超过。
这种“插花”般的细腻,同样体现在居家服务赛道。
折叠衣物、收纳餐具、清理桌面,这些对人类来说较为简单的动作,对机器人而言却是巨大的挑战。因为家庭环境是非结构化的,衣服的褶皱是随机的,杯子的摆放是无序的。GDPS要求机器人在这种“混乱”中建立秩序,这比在流水线上拧螺丝要难上千倍。
上海之所以执着于这些“琐事”,是因为这座城市深知:具身智能若想从B端走向C端,成为《方案》中期待的“消费级产品”,就必须跨越这道“灵巧鸿沟”。与其说上海是在办比赛,不如说是在倒逼产业链解决“最后一公里”的难题。这种“我们要什么,就考什么”的导向,正是上海产业政策一贯的务实风格。
当机器人遇上生死
如果说插花展示了上海对于生活服务的细腻,那么应急救援赛道则展露了这座城市对技术价值的硬核定义。
在分析GDPS时,特别提到了其在“社会价值”层面的考量。在应急救援赛道,机器人被要求在15分钟内进入模拟火场,自主完成灭火、搜救、引导三项任务。
这不是表演。在浓烟滚滚、视线受阻、高温高危的环境中,人类救援人员面临着巨大的生命风险。GDPS的态度很明确:让机器人去。用机器的“可接受资产损耗”去置换人类生命的“不可牺牲性”。
当一台机器人在模拟废墟中跌跌撞撞地爬起,利用雷达和热成像寻找生命体征时,我们看到的不仅是技术的进步,更是上海这座超大城市对于“城市安全韧性”的系统性思考。
这一刻,具身智能不再是资本市场的谈资,而是守护城市的“新英雄”。上海通过GDPS向全球释放了一个信号:最好的技术,应该用在最危险的地方;最智能的机器,应该服务于最宝贵的生命。
做全球开发者的“首席场景官”
将GDPS评为“全球前三”,一个重要理由是:“它不是纯学术比赛,而是产业链的展示,现场直接搭建了‘机器人供应链Max工坊’。”
这揭示了上海在具身智能领域的另一重筹划——全产业链落地的系统能力。上海的打法是“系统性”的。在GDPS现场,我们看到了一个有趣的现象:这里不仅有比赛,还有“找技术、找场景、找人才、找工作、找朋友”的全链路闭环。
这是一场典型的“上海式组局”。政府搭台,不再是简单地发补贴,而是提供场景(医院、工厂、养老院),提供标准(世赛级评审),提供连接(资本与技术)。
在“供应链Max工坊”里,开发者可以像逛超市一样看到全景拆解的机器人零部件,且实现了高度的国产化。从减速器到灵巧手,从传感器到控制算法,上海正在把整条产业链“端”到开发者面前。
具身智能的发展需要海量的真实数据。上海是全球城市复杂场景的绝佳样本:繁忙的港口、精密的工厂、密集的老龄化社区、顶尖的医疗机构。上海正在把这些场景开放出来,作为训练具身智能的“天然语料库”。
有评论认为,上海正在扮演“首席场景官”的角色。它不直接下场做球员,而是把草皮铺好,把规则定好,然后告诉全世界:想验证你的机器人能不能卖得出去?来上海。
结语:
2025年的冬天,注定会被写进具身智能的历史。
在此之前,AI更多生活在服务器里,它是无形的、抽象的。而在上海,我们清晰地看到了AI的“大脑”在不断升级的同时,还有了“身体”,它开始尝试拿起一枝玫瑰花,开始尝试扶起一位老人,开始尝试冲进火场。我们看到的不仅是技术的胜利,更是上海这座城市对未来的深刻洞察。
具身智能的尽头,不是更复杂的参数,而是更温暖的服务。未来的机器人不仅会跳舞,它们将在上海乃至世界的流水线上、厨房里、写字楼中,以“新工匠”“新伙伴”“新英雄”的身份,与我们共生。这或许才是大模型把票投给上海的真正原因——它让我们看到了技术最终的归宿,是人。
