蓝驰对话智元、银河通用、它石智航、灵初智能、Hillbot——具身智能:破晓时的「破」与「立」
2025-11-04 11:00 星期二

作为人工智能从数字世界迈向现实世界的核心载体,具身智能正迎来从“技术可行”走向“商业可信”的关键阶段。在蓝驰创投2025人民币基金合伙人年会上,蓝驰创投投资副总裁张校珩与智元机器人合伙人王闯、银河通用机器人联合创始人兼大模型负责人张直政、它石智航创始人兼CEO陈亦伦、灵初智能首席科学家温颖以及Hillbot创始人兼CEO韩铮展开了一场深度对话。

我们试图厘清几个关键问题:具身智能为何在此时迎来“破晓”?什么样的机器人才能真正走入生活与生产?中国在这一赛道是否具备系统性优势?从技术到商业的跨越,关键指标又是什么?

这场讨论不仅关乎技术路径的选择,更指向具身智能未来五年的胜负手。我们整理了对话实录,希望为你带来来自前线实战者的启发。

张校珩:请各位简单介绍一下自己,以及公司的核心使命和最具差异化的特点。

智元机器人 王闯:我是王闯。第一份工作在大疆,加入智元近两年,参与了从实验室到在2025年1月实现千台量产机器人下线的全过程。智元的差异化在于我们希望做从认知到行动都是全栈布局的公司。我们很早就搭了本体、运动智能(小脑)、语音交互和作业智能的团队,具身智能非常复杂,需要软硬件协同一体化设计,从一开始就系统性地融合,这才是落地最好方式 。

银河通用机器人 张直政:我是张直政,银河通用的大模型负责人。曾在微软负责构建基于OpenAI模型的系统,算得上是最早倾力大模型这项技术,来颠覆人工智能在感知和认知层面的变化。我希望可以把AI用到真实世界中,所以银河通用也带着同样使命。我们希望AI可以从“在电脑中思考”过渡到“在真实世界中自主作业”,并且这种自主作业能够规模化、稳定地提供多元服务,服务千家万户、千行百业。

它石智航 陈亦伦: 我是陈亦伦,它石智航的创始人兼CEO。过去十年我跟团队从0到1地推动了中国自动驾驶行业,打造了中国最好的 L2/L4 ADS系统。现在身边的很多朋友、邻居,都在用我们当年开发的系统通勤、出行和旅游。我们创业的源头就是把时代最好的技术转变为大众喜闻乐见的产品。我们相信,具身智能的超越将在用户体验和价值展现上,它能远超上一个时代的所有机器人技术。未来十年,在具身智能跟机器人如此令人激动的赛道上,我们将持续打造更加强大的物理世界AI。

灵初智能 温颖:我是温颖,上海交通大学人工智能学院副教授,长期做强化学习与多智能体系统研究。23、24年我们看到了具身的临界爆发点,便与师兄杨耀东共同加入灵初。长期愿景是打造一个通用具身智能系统服务千家万业,短期内,我们更聚焦于双臂的灵巧操作。因为灵巧手相对于夹爪,当前主要面向细分场景,希望未来能够扩展到更广泛的TO B、TO C应用。

Hillbot 韩铮:我是韩铮,Hillbot是我和本科同学苏昊两年前在美国创建的。苏老师2008年开始做机器学习相关工作,和李飞飞老师在Princeton和Stanford做image net项目。我们公司最大的特点是有将近十年的具身智能经验。主要有两大技术路线:一是基于强化学习,特别是以仿真数据做强化;二是facial intelligence派(AI)。我们最终目标是实现面向操作的技术模型。之前很羡慕国内的机器人公司,离供应链近、迭代快,所以今年我们也开始把一部分核心研发团队带回国内来。

张校珩:今天我们的主题是“破晓”——光已经出现但尚未完全明亮,就像具身智能当下的状态。作为这次破晓时分的真正推动者,请各位分享一下你们带着什么问题进入具身智能行业?这两年有哪些变化坚定了你们投入的信心?

智元机器人 王闯:我很早前就在思考,机器人为什么始终没有出现在我们生活中?为什么明明几十年发展了,却依旧无法真正解决劳动力短缺、老龄化、养老痛点这些最核心的问题。直到22、23年,大模型推理能力爆发、硬件稳定性提升,我真正感受到那个想象中的机器人第一次变得现实。我加入智元就是为了做能真正进入家里、工厂、能带来真实价值的机器人。

刚加入时,行业无人能做到量产,甚至机器人走路都是奢侈,我们两年里从实验室到千台全尺寸人形机器人量产下线。尽管这两年并不轻松,但每天看到产品在现实世界成长,我确信我们在把未来提前。

银河通用机器人 张直政:我一直在思考一件事:智能的本质在哪里?人类奋斗史是靠“摸爬滚打”而非“望闻问思”,从实践中获取知识。今天的大模型虽然能理解世界,但仍被困在屏幕里。智能真正的scaling law是:Learn to interact,interact to learn,也就是先学会与世界交互,再从交互中学习和成长。只有让模型在物理世界中行动,智能才能真正向理解与自主演化。这正是具身智能的意义。

与自动驾驶只解决单一目标不同,具身智能是在沿途下蛋,每一步智能增长都能变成真实产品。这两年我们在零售、工业、家庭场景完成了真实落地,让我更确信具身智能不必是终极通用形态才能落地,它可以在有限场景内有限自主完成任务,从而达到泛化能力

它石智航 陈亦伦:三年前我离开华为自动驾驶团队时,交付的最后一个产品特性是端到端系统。当时在非常复杂的人车混杂城中村场景部署后,工程师们都被它灵活智能的穿行效果惊呆了。一个黑盒的神经网络,仅靠端到端就能实现惊人效果,刻我意识到:算法替代复杂工程栈的时代已到来。

自动驾驶和机器人技术同宗同源,自动驾驶技术栈早期全来自机器人团队。当端到端在自驾中展现巨大威力,我深信机器人技术本身也必然存在一套对等的全AI化算法全栈。现在的机器人行业一开始就走向了全AI化,我们认为这既有挑战,也预示着巨大的潜力。自动驾驶其实就是移动具身智能,机器人只是在更高维环境中进行更复杂操作。

灵初智能 温颖:其实2021年我们曾做过大模型创业,但做得太散,且融资不足,到2023年公司就关掉了。到了2023、24年,大模型和视觉语言模型发展较快,硬件成本也在快速下降,早期一个灵巧手要近百万,现在成本已大大降低。此外,现在我们的团队组合非常完善,有技术强、动手能力强的人,也有商业化和工程化经验充足的人,比之前的“纯科学家创业”更靠谱,所以我觉得这是一个比较好的机会。

Hillbot 韩铮:回想为什么进入这个行业,其实是从2022年此时的一个基础判断开始的。第一,具身智能所需数据从何而来?当时看到生成式模型,尤其是Dall-E出现,我判断开放世界的生成数据新方式可以出现,只不过从文字到2D、3D需要时间。第二,我们在与Google Robotics team合作时发现,靠仿真(Simulation)去做基础模型的推进,很难教会最聪明的一拨人。这让我们决定要自己搞公司,从头做到尾,提供一个完整的解决方案。

其实我觉得台上的各位都有一个共同的目标,不管是垂直场景还是泛化能力,最终还是要导入真机在同环境中让大家去试。目前仿真学习和强化学习两条路线同时推进,至于熟优熟劣,我们感觉明年上半年,这两种路线的讨论会有明显的收敛趋势。

张校珩:我们都说具身智能是中国主动选择的AI主战场,从一线视角来看,中国在这场“中美具身大战”中的优势具体体现在哪些方面?

智元机器人 王闯:我的基本判断是:具身智能赛道最后一定是中国赢,但这并非易事。过去几十年,每一场先进科技竞争中,我们都在追赶。但当我博士毕业到大疆后,我发现这个巨大的冰山出现裂缝——从无人机、激光雷达(中国公司统治)、扫地机器人到割草机器人,中国制造都做到了全球最好。而在新能源领域,海外是“草原上长了一棵大树”,中国是“一片森林”,生命力更旺盛,人才也更强。

具身智能与这些行业都有相关,因为它需要量产能力、智能化、软硬件协同一体和供应链,这几点全是中国占据巨大优势的。此外,中国人特别努力、讲究实用主义,且能轻松获取全球知识,而海外很多人可能只懂英文。基于这些经历和当前产业,我判断很可能在五年内就分出胜负,而中国企业将是做得最好的。

银河通用机器人 张直政:这个问题不是站在一个公司或个人的角度来看,是站在整个行业去对比两个国家或是两个体系之间的优越性。我们首先要思考:具身智能的最终追求的价值是什么?在我看来是用新生产力带来更高效的经济和社会效率。

基于这个目标,中国有三大优势:一是足够大的市场。具身最终要解决社会问题、生产干活的问题,巨大的市场意味着能够及时验证、快速迭代,这对技术转变为体系化产品至关重要。二是成熟且完整的工业生产体系和供应链。具身智能不仅需要聪明的大脑,还需要硬件载体,像自动驾驶造车也依赖国内供应链。我们不仅要追求高运动性能,还要实现硬件的车规级可靠性,才能实现模型的大规模稳定部署,避免运营成本爆炸。三是技术公司与客户、产业的快速连接。在资本和政府的牵引下,技术公司能快速与客户连接,形成联动,从而达到TPF(Technology-Product Fit)和PMF(Product-Market Fit)。

我相信在这三个不可动摇的优势的帮助下,我们具身智能一定会跑在世界前列,也会带领全世界的具身智能公司把这项技术真的从一个单点技术突破变成一个体系化,最终形成生产力、服务力回馈给用户和整个社会。

它石智航 陈亦伦:我认为具身智能或机器人行业成功的三个要素是:真实而丰富的场景、源源不断的数据、软硬结合的高频迭代。中国在这三点上毫无疑问都能占到先机。而美国的优势在于:超一流团队的认知、丰富的资源(特别是算力)和比较高的容错率。美国容易滋生具有重大影响力的颠覆式技术,所以我们也需要重视它的一些进展。

但我认为算力对具身智能的优势并不明确,它的算力需求介于自动驾驶(千卡)与大模型(万卡)之间,差不多几千这个数量级,就此来看美国算力不足以形成非常明确的优势。最后,在软硬结合方面,我认为中国一般没输过,接下来具身智能或者机器人这一仗,在我看来最好的竞争对手还是特斯拉。

灵初智能 温颖:整体生态而言,从零部件供应、生产、数据、算法模型到下游应用场景的丰富度,中国都远超其他国家,国内对引入具身技术改造流程有很高的共识和接受度。此外,我们相对于美国有信息不对称的优势。很多来自海外的学者和创业者近几年回国,能带回许多前沿信息,但国内沉淀的硬件和实操认知,国外很难获取。相较于这样信息不对等的优势,我们也有更有信心比他们做得更好。

Hillbot 韩铮:我也同意中国最后会胜出,至少我们有很强的团队。但我也提出一点担忧,中美脱钩给核心技术的交流带来了障碍。过去几年,中美在学术会议和线下活动中,对核心技术的交流明显少了很多,如果不长期在这个氛围里面跟大家多交流的话,很多信息很快就会过时,这会给技术迭代带来一定的障碍。即使有活动能参加,对方能讲的信息也有限,这是客观条件。这是确实是一个挑战,但我认为中国的团队最终还是会胜出。

张校珩:一年之后如果我们再次相聚在此,您希望那个时候您的公司给这个行业带来什么?

Hillbot 韩铮:希望行业形成上下游分工与协同共识,而不是简单竞争。

灵初智能 温颖:在商业化方面,实现1000台机器人在各类物流、工厂场景持续稳定服务。

它石智航 陈亦伦:希望明年能够向大家完整汇报具身智能的Scaling Law。

银河通用机器人 张直政:希望向大家展示现在难以想象的真实落地成果。

智元机器人 王闯:希望智元成为商用部署数量第一的公司。