2026年春天,江苏宿迁出现了一批特殊的"上班族":全职妈妈做饭时头戴设备,舞蹈老师空闲时线上接单,果农绑枝条时顺手采集数据。他们不是在拍短视频,而是在给机器人当"老师"——月薪四五千,时间自由,干的是家务活,产出的是AI训练数据。
这背后是京东在宿迁落下的一步重棋:建设全球首个覆盖"采集、存储、标注、训练、评测"全链路的具身智能数据基础设施。
机器人为什么需要人来教?
过去几年,机器人后空翻、跑酷的视频刷屏,但一到真实场景就"翻车"——能翻跟头的机械臂,叠不好一件T恤。根源在于,绝大多数AI学的是网上的文字和图片,缺乏对真实物理世界的理解。扶人要用多大力?摘水果怎么不伤果蒂?这些"常识"只能从真实人类行为中提取。
行业把这类能理解物理世界的AI称为"具身智能"。据预测,2026年中国具身智能市场规模将突破万亿,已连续两年写入政府工作报告。但全行业卡在同一个瓶颈上:数据严重不足。训练一个实用的机器人模型需要千万小时真实场景视频,而全球可用的高质量数据仅几十万小时,缺口超过95%。
用机械臂遥控生成的数据又太"干净",缺少真人动作中的不确定性和意图差异。所以最好的教材,就是人本身。
宿迁凭什么?
京东计划两年内动员60万人参与采集,仅宿迁就超过10万市民,目标积累1000万小时真实场景视频。选宿迁不只因为刘强东的故乡情结,更因为京东在此深耕十余年,累计投资超200亿元,建有客服中心、物流基地等十余个项目,双方信任深厚。当地政府从签约到运营仅用40天,还能联动职业学校开设"订单班",这种组织动员能力是花钱买不来的。
这事的意义不止于商业
京东自研的JoyEgoCam头戴终端仅重220克,能精确捕捉手部毫米级动作和力度变化。采集到的数据已在京东数据交易平台定向开放,具身智能中试基地也将在宿迁落地。
这套模式像极了二十年前京东自建物流——当时所有人都说该外包,刘强东偏要自己干。如今,京东在行业基础设施缺失时,再次选择了最笨、最重、也最正确的路:不是等数据从天上掉下来,而是扎进烟火气里,一小时一小时地"垦荒"。

