(上接01版)一个瓶颈性问题浮出水面:数据极度短缺,抓取、行走、避障、力控——这些看似基础的动作,需要机器人在不同场景中反复训练才能掌握,但高质量的现成数据严重不足,企业不得不从外部高价购买。
数据的缺口究竟有多大?据《科技日报》报道,全球范围内研发端对高质量具身智能数据的需求量约为120万小时,而全行业每月数据产出量仅为25万至30万小时。完成一个高质量模型的训练,至少需要1000万小时量级的数据,但当前市场上成熟的具身智能数据集只有几十万小时,远远无法支撑行业训练出高质量、通用的具身大模型。
与大语言模型使用的互联网文本数据不同,具身智能需要的是“交互者视角”的数据——不仅要包含视觉信息,还必须包含实时的力反馈、触觉感知以及电机扭矩的连续变化。这类数据无法从互联网上直接获取,几乎需要从零开始积累。
“刚出厂的机器人如同懵懂孩童,在数据喂养与场景训练中不断进化,最终练就成熟的具身智能模型。”赵同阳表示,2025年是具身智能科技迸发的一年,短短一年间技术迭代迅猛,数据起到了关键作用——谁拥有海量高质量、多模态的真实世界数据,谁就能让机器人变得更“聪明”。
正因如此,众擎公司的训练场显得尤为关键。企业计划部署160台人形机器人,建设1万至2万平方米的室内训练场景,训练涵盖工业装配、焊接、物流搬运,医疗服务、餐饮服务、仓储服务等多个领域。充分利用我市作为农业大市的特点,还设计了农机采摘、喷洒、温室操作等农业训练场景,以及高温、高寒、高危特种训练场景,目标是用超真实落地场景,让机器人从“出厂新手”快速成长为“岗位能手”。
我市的产业禀赋为数据采集提供了独特优势。牧原集团、飞龙集团、龙成集团等工业强企拥有丰富的产线场景,广袤的农田、山地、水域等自然环境远超普通训练场的数据价值。这些真实训练场景,正是具身机器人技术成熟的“磨刀石”,丰富的产线场景将源源不断为众擎机器人提供“数字燃料”,助力其在人形机器人赛道上构筑起难以复制的核心壁垒。
城市赋能——
从“人口红利”迈向“数据红利”
众擎公司扎根我市,不建制造厂,而是建训练场。
这个选择背后,其逻辑就如同给淘金者“卖铲子”——既能解决具身智能的“卡脖子”难题,又能用较低成本,在竞逐具身智能的新赛道上卡牢“身位”。
今年,千寻智能、灵巧智能、灵初智能、鹿明机器人等行业头部企业先后公布了年度战略目标,不约而同将“数据”列为重点,并锚定一个方向——2026年要采集百万小时的有效数据。市面上巨大的数据缺口,为南阳发展具身机器人数据采集产业打开了窗口期。数据服务费、标注服务费,以及“防爆巡检数据集”“中药材识别库”等高价值行业数据集的交易授权费,都将成为可观的收入来源,还将拉动服务器租赁、网络带宽、数据存储、仿真软件开发等上下游产业链。
更深远的变化,在人才层面。随着多模态大模型的发展,南阳将需要大量懂机器人运动学、懂农业知识、懂医疗流程的高级标注师,大量机器人维修和保养工程师。这将显著提升本地就业岗位的薪资水平和技能层级。通过人才回流与“诸葛英才”计划,一批高科技项目有望随之落地,吸引更多南阳籍学子返乡发展。
南阳理工学院软件学院院长刘黎明说:“南阳发展具身机器人数据采集产业,相比一线城市有明显的成本优势,还有扎实的人才储备。理工学院等南阳高校都已经开设了相关专业,校企联合将为南阳培养一批既懂技术又懂本土产业的复合型人才,为城市建设提供人才支撑。”
今年4月,赵同阳一行专程到南阳理工学院考察,双方围绕人才联合培养、技术研发创新、产学研融合等达成广泛共识,计划共建研发中心、产业研究院,定向培养适配企业需求的高素质技能人才。
对于南阳而言,引入众擎机器人是落实《南阳市推进“人工智能+”行动方案(2026—2028年)》的具体举措,更是抢占新质生产力风口的关键落子。到2028年构建高质量数据集30个以上,建设行业垂直大模型5个左右,打造“人工智能+”典型应用场景50个以上,实现人工智能相关产业规模超100亿元。通过共建数据采集与标注中心,南阳正将传统产业优势转化为数字经济新动能,从“人口红利”迈向“数据红利”。
未来,南阳将依托“训练场+”模式,持续放大数据采集、模型训练与场景落地的叠加优势,打造豫西南乃至中西部地区具身智能产业枢纽。当一批批在南阳训练完成的具身智能机器人加速融入千行百业,它们将成为实体经济转型升级的新动力——这是属于南阳的未来图景,也是属于中国智造的产业答卷。②4