智元这回跑在了马斯克前面

马斯克都没做到的事,彭志辉和他的智元机器人做到了。
不久前,特斯拉确认旗下人形机器人产品Optimus Gen3将在今年夏天启动小批量试产,2027年才有望大规模量产。尽管这个节奏已经历经多次跳票,但马斯克的愿景依然是全球行业的参考系。
但转折很快不期而至,本来要按“年”来规划的爬产进度,被压缩到了“月”的单位。
3月30日,智元机器人宣告量产基地走出的人形机器人突破了一万台。这距离他们上一次举办五千台下线仪式,过去了不到三个月。
智元的“破万”意味着国内具身智能从实验室,踏进了规模商业化的节点。
对于这家成立不到三年的中国玩家来说,在量产这件事上赢过行业巨擘,这本身就是一种宣言。
如果把过去两年国内人形机器人的发展画一条曲线,2023—2024 是“Demo 曲线”,2025 年开始进入“工程现实曲线”。
两条曲线的分野在于,前者依靠算法、动作库、场景编排和渲染就能造出“效果”;后者只接受一个标准:连续无故障运行。
"在很多人眼里,量产制造好像就是流水线、开模、注塑、组装等一系列标准化的流程。但实际对人形机器人产品品类来说,规模化本身就是最难的技术问题之一。"
3月30日,在会后的访谈中,智元联合创始人、总裁兼CTO彭志辉向华尔街见闻指出,机器人行业规模量产远比想象中困难的多。
他作了一个对比,消费电子出了故障大不了重启;但机器人一旦失误,"任何一点微小的品质故障都会在实际运行过程中被无限放大,可能会造成人员受伤、环境破坏后果严重"。
这件事的难度,在智元内部 2024 年的量产阶段体现得很彻底。
智元高级副总裁兼通用业务部总裁王闯向华尔街见闻回忆,在那一年里,智元正处于从第1台艰难爬坡到第200台的阶段,这是公司的“至暗时刻”。
当年 8 月新品发布会后,智元一口气发布五款机器人,其中最火的远征 A2,单台售价超 50 万元。 发布会后,订单如雪片般飞来,但智元却完全接不住——产品无法量产,技术无法落地,商业模式完全走不通。
王闯说,当时生产线几乎没有标准化可言,做出来的机器越多,团队能用于干活的时间反而越少,因为大量时间都被消耗在维修上,每台下线的机器人甚至都不一样,工程师必须逐一调参。
那是一段用人力填补工业化鸿沟的苦日子。到了2024年年底,为了解决第一批量产带来的海量问题,智元先后有150多人次的研发人员驻扎在工厂一线。
每一个量级的跨越,解决的都是完全不同维度的问题。接下来,从200台到1000台,最大的瓶颈从产线转移到了供应链。
彭志辉向华尔街见闻透露,智元最早决定做人形机器人的时候,去行业里调研了一圈,"发现并没有能够适配我们、批量交付、成熟可靠的核心部件供应商"。
智元内部员工称,早期的供应商凑一凑交个一两百台的货或许还能应付,但当订单规模达到千台甚至万台时,原有的体系和质量标准便瞬间崩溃,产品根本经不起大批量的返工折腾。传统关节、减速器、灵巧手、电池没有任何一家供应商能满足千台级的交付稳定性,更不要说一致性。
既然没有现成的路,智元只能选择自己修路。彭志辉说,“我们是和供应链一起成长,把他们拉进来做联合研发”。从材料工艺到工装夹具,从测试台架到老化流程,全部重新定义。
智元在关节、灵巧手等核心零部件上采用了与供应商联合研发的新工艺,让部件更轻、更准、寿命更长、成本更低。他们还构建了"半小时供应圈",要求核心供应商必须在半小时之内能响应。
这种深度绑定的供应链策略,在短期内看起来很重,但长期来看,恰恰构成了智元的护城河。
如果说供应链能力决定了智元能不能造出一万台机器人,那数据飞轮的复利,则决定了这一万台机器人造出来之后能产生多大的价值。
"以前做机器人的思路是先造一个本体,先把身体造出来,有一个硬件,再往里面开发塞一些'大脑'、模型、算法。但现在随着一万台机器人下线,身体和大脑开始同步进化。"彭志辉如是说道。
如今,每一台下线的机器人都会被部署汽车制造产线、3C电子车间、商业服务空间持续收集数据。
这些真实数据反过来又会以前所未有的速度训练智元的基座模型,使得模型变得更加泛化、更加实用,从而推动机器人解锁更多的复杂场景。
"机器人会越用越聪明。"彭志辉说,"一万台是让我们飞轮彻底转起来的关键节点。"
事实上,这个逻辑和智驾行业的演进路径高度一致。斯拉的FSD12之所以能在2025年前后实现质的飞跃,核心原因就是数百万辆在路上行驶的车辆持续贡献真实驾驶数据。眼下,智元正在人形机器人领域复刻同样的路径。
在王闯看来,任何一项颠覆性技术在早期发展时,都会让人觉得步履维艰、无比缓慢,但当它真正跨过某个奇点,像海啸一般席卷而来时,所有人都会惊呼它的速度太快了。
就像曾经的电动汽车和智能驾驶一样,人形机器人也正在逼近这个爆发的临界点。
根据IDC的数据,2025年全球人形机器人出货量接近1.8万台,同比增长约508%。其中,中国企业在全球出货量中占据了主导地位,超过美国同行。
2026年,行业进入规模量产攻坚期。集邦咨询预测全球出货量将突破5万台,同比再增超过700%。智元在开年不到三个月就完成了万台下线,按照这个节奏,王闯在发布会上给出了预测:"十万台可能是在2027年年底。"
这个预测建立在两个前提之上,首先是全自主的技术部署态,让机器人脱离人的操控,理解环境、自主充电、持续适应更复杂的任务;二是全球化,王闯说,“机器人品类需求全球都是通用的,老龄化、少子化、劳动力不足以及枯燥重复的岗位越来越招不到人,这是全球面临的问题”。
从2023年8月问世的远征A1,到2026年3月第一万台远征A3走下产线,智元用不到三年的时间完成了一个几乎不可能的跨越。
这家公司的故事,本质上是中国制造业系统能力在一个全新品类上的又一次集中释放,同样的剧本已经上演过很多次,但每一次依然令人震动。
一万台不是终点。但从这一天开始,人形机器人不再只是想象中的未来概念,而是当下的产品。
以下是华尔街见闻·全天候科技与智元联合创始人兼CTO彭志辉、高级副总裁兼通用业务部总裁王闯的对话实录:
全天候科技:在万台量产的背后,智元在供应链、成本控制、产能上做了哪些关键布局?
彭志辉:刚才也提到了一万台的难度有多大,从一千到一万的过程用了一年多的时间,完成了10倍量级的跨越。这背后挑战的是在制造效率、场景落地、客户价值、数据飞轮、供应链共同成长五个维度的综合能力体现。可以说,智元是全球首个真正跑通从实验室样机到工业化大规模交付全流程的智能公司,最大的难点是批量一致性和成本控制挑战。
机器人不像手机,出了问题,软件问题重启,硬件问题也不会有什么损伤。但是机器人一旦失误,任何一个环节掉链子,量产品质会崩盘,也会给用户、给环境带来不可逆转的伤害。核心零部件的稳定供应、整机的成本压降、品质、质量、稳定性、可靠性都是“硬骨头”。
为了搞定这些问题,有两件事情比较重要:
第一,死磕供应链。和供应链共同成长,重新定义新行业标准。我们建立了全球首个具身智能标准化供应体系,甚至把核心伙伴拉进来一起搞联合研发,比如说在关节、灵巧手等核心零部件上采用了新工艺,这些工艺是跟供应商联合研发的,让部件更轻、更准、寿命更长、成本更低,会体现很强的产品优势。
第二,重构生产模式。包括我们现在所在的场地搞了中试工厂的验证工艺,量产工厂保证稳定,中试工厂是提前验证各种工艺和组装的流程。还通过订单驱动等柔性生产的方式,不仅把核心零部件做到了自主可控,而且还构建了“半个小时供应圈链”,提出了一些对供应商的诉求,供应商必须在半小时之内能够响应。
万台不是终点,而是证明我们有能力用工程化的确定性把具身智能真正从玩具变成未来的生产力必不可少的关键节点。
全天候科技:具身智能的ChatGPT时刻到了吗?
王闯:最大的区别是客户经常反馈产线会经常变更,比如说电芯上下料的产线可能过段时间就改造成其他不同型号的电芯,甚至是完全不同的物料上下料。如果用传统自动化方法的话,经常需要把以前做得好的设备报废掉,再开发新的设备,至少是让工程师再驻场一个月开发新的算法。
具身智能最大的意义在于泛化性,就像我们现在用GPT问它任何问题,有很多都是模糊的回答,你问的非常模糊,但它能够泛化的理解。我们希望在具身智能的物理世界中也能够泛化性的理解它要做什么,这可能有非常大规模的预训练,再加上针对工位采集数据进行强化的训练,最终让成功率达到产线能够接受的成功率,产线往往是999、9999的标准,节拍要和人进行对标。
现在我们看到在一些上下料的场景已经逐渐开始跑通了,希望未来轮式在工厂的更多场景,以及双足机器人在接待、导览、导购的场景也能逐渐跑通。
全天候科技:近期智元在算法、仿真技术等方面接连取得最新突破,第一万台下线的机器人是否搭载了这些技术成果,万台规模量产所带来的真实数据与工程反馈,又会如何反哺技术的迭代与真机的场景适配能力?
彭志辉:数据闭环/数据飞轮对我们来说非常有价值和有意义。第一万台量产下线是远征A3,是最新推出的新型号产品,现在还没有达到批量出货的阶段,很多软件功能还没有达到阶段,还在继续持续优化。
很多新技术肯定会率先在新产品上做应用和验证,比如A3在本体方面的轻量化、续航、推重比、交互能力上都有了大幅度升级,整机只有55公斤,比大多数这个尺寸的人类还要轻,续航能达到10小时以上,还搭载了各种新型传感器(比如触摸传感器)。
更核心的是“大小脑”软件跟算法模型,融入了最新的全身运控的模型,包括群控的算法,可以群体控制的算法成果。
目前除了像远征这样的新型号,之前已经发布的产品也已经在真实场景里落地应用了,比如说“精灵”系列,已经在工业制造、物流、安防等场景落地。像我们在龙旗科技的平板电脑产线就有我们的A2 24小时不断干活儿,做屏幕的上下料。
G2还在均胜这种电子工厂,能以12秒多超过人类的速度完成高难度的工装、三销定位的装配,成功率几乎做到100%,这些场景本质上对机器人的精度、稳定性要求都非常高,是传统自动化解决不了的。正是这样的场景非常能体现具身智能的价值,不是替代人类,而是要让机器人具备一次训练、多次部署的泛化能力,补充人类的工作岗位。
“数据飞轮”也是过程中最大的红利,在真实环境里不断干活儿,也能给我们收集足够多的数据,数据能帮助我们突破未来具身智能的能力上限。新下线的机器人是在“出厂即进化”的一条路上,依靠仿真数据和真机数据,现在有了真实的数据飞轮闭环,为机器人未来能够真正进入大规模生产力价值场景做非常好的铺垫。
全天候科技:现在这一万台机器人将分布在哪些领域,哪些具体场景的ROI已经跑通了?
王闯:我们现在有8个主要的商用场景,有科研用户、数据采集、文娱表演,更多是开发态。在部署态有做讲解接待、工厂上下料场景。未来会探索出更多场景,比如说做真正的前台接待,能够带有交互、带有作业,比如说在工厂里一个工位做一些事情之后,能很快的调整到另一个工位,像真正的“人”一样工作。
全天候科技:现在行业正处于百花齐放的状态,无论是形态、算法、场景应用,智元如果要成为终局的独角兽,最重要的壁垒是什么,整个具身行业有没有收敛出来的共识?
彭志辉:我们一直有对外宣讲,我们的核心壁垒就是我们坚持的“一体三智”的全栈战略,之前每一次产品发布也都会强调,为什么我们要做大而全全栈的技术布局,而不是专精在某一块。
因为我们是以终为始,瞄准最终的应用场景,要跑通真实的场景,单靠一个技术点是打不穿的,既需要机器人有很强的交互能力,作为很好的人机交互界面,又需要它能真正干活儿,又需要它的运动能力足够强,区别于传统固定式的工业机器人。
所以既需要运动智能,又需要交互智能,又需要作业智能,同时本体要足够成熟、可靠、稳定、低成本,是系统型的工程,为什么我们始终坚持“一体三智”全栈的技术路线,把机器人的本体、运动智能、交互智能、作业智能深度做系统融合。
我们在AI底层大模型、垂直行业应用上也积累了大量Knowhow,这些Knowhow也是我们自己的“护城河”之一。刚刚提到建立了全球首个标准化的供应链生态,这也是很强的护城河。
全天候科技:当前机器人正处于从“拟人”向“类人”进化的阶段。过去一年机器人“大脑”有哪些进化?在灵巧手负载和全身力控平衡方面,距离理想的“数字生命实体”还有多远?
彭志辉:这是对未来的畅想。
首先,机器人大脑的进化是主旋律,为什么这几年人形机器人会这么火?并不是因为本体有什么突飞猛进的黑科技,而是因为AI的发展、大模型的发展,从2023年ChatGPT为代表大脑的进化才是主旋律,在过去一年这个时间变化非常快,早期在大脑这块更多是用类似ACT、Policy这样的技术,能解决序列生成的问题,但本质上还是偏动作预测。
现在学术界、工业界主流的趋势全面转向了VLA,基于大模型的VLA技术。这不仅是换个模型架构的问题,而是让我们真正开始尝试想去延续大语言模型那个神奇的所谓的Scaling law,堆规模、堆数据、堆算力,希望让机器人的通用智能能涌现出来。这是大范式的转变。
同时,技术也是持续演进迭代的,比如说未来的世界模型也会发挥很重要的作用,能让机器人像人类一样做所谓的反事实推演。人类做一件事情的时候会先在脑海里推演一遍下个动作带来的后果,再动态的调整自己的策略。而不只是看到什么就做什么,这才是从感知到反应,从认知到规划的根本性跨越,当然还需要技术的不断迭代和演进。
核心零部件现在也还存在瓶颈,比如说灵巧手硬件目前还是很大的瓶颈,如果我们需要非常高自由度、高负载,有很强的感知能力。比如触觉做的非常好,同时又要非常低成本。这几点在工程上是非常矛盾,现在整个硬件方案都还没有收敛,我们也在尝试不同的技术路径、新的结构设计方案、新的传感器选型,试图能够在性能和成本之间找到比较完美的平衡。
刚刚提到了“一体三智”,每个领域的算法基座模型都还需要做一定的迭代。
最后离我们想象理想中的数字生命体有多远?我的看法应该是会比一部分人想象得快,但还需要一定时间,不管是身体还是灵魂。“身体”刚刚讲了硬件还是有些需要突破的空间,工程化、成本也在动态平衡的过程中。“灵魂”是大脑和小脑,更重要,通用智能、对世界的理解、长期决策、跨语义多模态联动还处在相对早期的阶段。
但也正是因为这条路没有那么简单,中间有这么多硬骨头要去啃,才是非常值得我们全力投入、去死磕、去突破的原因。
全天候科技:中国机器人行业存在泡沫吗?
王闯:任何技术的发展在早期的时候大家看着都是比较慢的,在它真正像“海啸”一般来临的时候大家会觉得太快了。可以想象一下电动汽车,汽车电动化十几年来国家都在补贴,一直在推广。但普通老百姓购买比例一直都非常低。
事情就发生在最近两三年,好像突然加速了,充电桩可能比加油枪在某些城市还要多了,渗透率超过了50%。汽车的智能化也是的,智能驾驶研究了几十年,刚开始的时候大家都觉得这个技术体验太差了,都不太想用。最大的变化在最近一年,我自己体验各种第一梯队的智驾,已经能让我非常放心地使用它了,这是非常革命性的时间点来临。
人形机器人也是一样,复杂度只会更高,像远征A3现在里面用了非常多新材料、新传感器,主控算力也进行了大幅提升。这么复杂的产品现在才刚刚下线第一批,里面还有很多很多问题要解决。对我们来说,希望踏踏实实把每一步都走稳,把东西、产品真正做好,也期待着过程中有很多合作伙伴、上下游供应链、客户跟我们一起努力,把产品做好。
做好之后会把它先在力所能及的场景中用起来,比如说机器人刚开始的泛化性相对有限,不能说所有的任务都让它做,但约定一些种类的任务已经做得非常好了,因为它重复性执行和24小时不睡觉是天然跟人类相比的优势,可以帮助我们来做枯燥重复的事情。
接下来就是静静的等待着加速的过程,我现在也说不好是5年、10年还是更长,但相信某一天如果大家看到很多机器人能真的在身边帮我们做一些事情的时候,大家会觉得这个过程发生得很平静又很自然,并且能深刻的改变社会。我非常非常期待这个时间,我会把自己未来的职业生涯都奉献在过程中,跟同事一起努力。
至于中国跟国际的对比,很显然在国际上有很多从0-1的创新做的非常非常好,中国在从0-100的过程做的非常好,尤其是在工程能力、应用及构建起机器人迭代的“飞轮”方面都做的非常好。
最近一两年我有很大的体会,中国在一些核心技术的从0-1上开始逐渐有突破,比如说机器人触觉、算法,像机器人感知和控制相结合的算法,中国都有很多很好从0-1的东西出来。
我相信在未来中国学从0-1会学得很快,会越来越加速,因为有足够多聪明的人。但其他国家学中国的从1-100没有那么容易,可能构建起整个体系需要巨大的努力和相对很低的成功率,我相信在具身智能产业里,中国会持续领跑全球。
全天候科技:如何看待目前人形机器人你追我赶的竞赛,智元的下一步目标是什么?
王闯:我们并不是在做“量产竞赛”,现在大家所在的工厂是中试工厂,像远征A3是在这个工厂生产的,更多是用来验证整个产线。其实这个工厂里大部分都没有用到自动化设备,是验证、设计,研发也经常会跑过来迭代产品设计。真正量产工厂在奉贤工厂及其他地方(工厂)。我们现在如果想做量产竞赛的话,产能远不止现在这点。
为什么没有做呢?因为我们更看重的是机器人怎么在真实场景中用起来,怎么满足客户可持续的需求。比如客户买了机器人在产线上验证,需要先做POC让功能跑通,比如节拍达到12秒或多少,客户真正满意了才会在其他类似的工位上逐渐推广,这是有真实需求驱动的。
还有双足的,像灵犀、远征机器人用在展厅讲解,现在也有累计有两三百台在不同的展厅工作。如果客户觉得自主免维护、机器人交互能力、接待能力、多语言能力真正能帮助到他的时候,他愿意批量化复制和推广的时候才是我们最期待的,这时候会根据客户的需求安排产能,并不会想着跟谁竞赛,因为生产出来变成库存对我们来说是没有意义的。
