当下,正处于人工智能爆发式增长的阶段,而人形机器人也正以超乎想象的速度走进我们的生活。由Brett Adcock发起并创办的机器人公司Figure AI在2022年成立后,迅速获得了包括英伟达、微软、OpenAI创业基金和亚马逊创始人杰夫·贝索斯的青睐,在一轮融资中筹集到6.75亿美元。Figure AI公司创始人Brett Adcock和他的团队在短短两年内,从零开始,打造出了令人瞩目的Figure系列机器人。
在本次访谈中,Brett Adcock将带我们深入探索Figure 02的奥秘。从CPU和GPU数量的提升,到电池容量的大幅增加,再到创新性的外骨骼结构和先进的摄像头系统,Figure 02的每一个细节都证明人形机器人距离我们越来越近。
而Brett Adcock的愿景远不止于此。他相信,未来每个人都将拥有一台人形机器人,廉价、可靠的劳动力将成为现实。这一大胆预测背后,是Brett Adcock对降低成本、提高生产效率的预期,也是他对人工智能与机器人技术结合的憧憬。他坦言,实现这个愿望并不容易,但团队正以稳定的步伐向目标迈进。
此外,Brett Adcock还将分享他与OpenAI、微软等巨头的合作故事,以及他对中国机器人产业的看法。
精彩观点如下:
1.机器人通常需要至少三个硬件版本才能达到相对商业化、可靠且无误的状态。2.降低成本唯一的方法就是提高产量。在未来,随着产量的增加,机器人成本可以降到每台设备低于2万美元,甚至更加便宜。3.如果机器人能够胜任人类所能做的所有事情,也许会比汽车或手机更重要。4.人形机器人的独特之处在于,它们能够直接融入我们的现实世界。5.中国肯定会出现一些非常厉害的机器人公司,因为他们正在进行的项目数量非常庞大。在人形机器人领域,我认为中国将是下一批长期保持真正竞争力的国家之一。
以下为对话(有删减):
01
机器人需要迭代三个版本才能商业化
主持人:Brett,很高兴你能接受访谈,上次参观你的办公室还是两个月前的事情,那时Figure 02还未正式面世。不得不说,你们团队在产品设计上的迭代速度真是令人惊叹。
Brett:欢迎大家来到Figure的世界。我们拥有100多名才华横溢的工程师。就在上周,我们正式发布了Figure 02,这是我们第二代的人形机器人,目前已经有几台机器人开始进行测试工作了。
主持人:在短短不到两年的时间里,你们从零开始取得了如此显著的成就,这真是太快了。能不能跟我们谈谈Figure 01和Figure 02之间的主要区别?你们在Figure 02上都做了哪些重要的升级和改进?
Brett:Figure 02在很多方面都进行了升级。首先,我们大幅增加了CPU和GPU的数量,达到了之前的三倍,从而极大提升了机器人的整体计算能力和推理速度。其次,我们将电池容量提升了一倍,达到了约2.3kW·h的水平。电池系统被巧妙地安装在机器人的躯干中间位置,紧邻计算单元和GPU。所有的电线都被精心内置在机器人内部,没有任何电线或电子设备裸露在外,这样的设计不仅提高了机器人的可靠性,还使得整体外观更加紧凑和美观。我们还创新性地引入了一个外骨骼结构,这种外壳承受着了全部的负荷,有助于减轻机器人的整体重量,而设计灵感来源于我之前在航空领域的工作经历。
此外,我们还增加了六个机载摄像头,大幅提升了机器人的感知能力和对周围环境的观察能力。这些摄像头分别被安装在机器人的头部、背部和下半身等关键位置。
我们发现,一个既能承受碰撞又能保持足够刚度的结构是理想的质量权衡方案。而Figure 01则展示的是结构和外壳共同承受载荷,这种设计并不完美,因为结构的尺寸实际上是由碰撞载荷决定的,这导致在很多地方都增加了不必要的重量。
主持人:现在你们有多少台数字机器人正在运行?
Brett:大概10台。我们基本上每周制造一台新机器人。
主持人:我之前看到你展示了Figure 01,然后是Figure 02,还有Figure 03的设计图。你能分享一下你们的快速迭代策略吗?
Brett:我的经验法则是,机器人至少更新三个硬件版本才能达到相对商业化、可靠且无误的状态。我们的目标是在极端情况下,让软件层面的挑战成为主要问题,这意味着我们需要非常可靠的硬件基础,它必须安全、稳定、成本低廉,同时我们还能够高效生产。就像iPhone一样,第一代iPhone并不是世界上最棒的手机,但到了iPhone 3和4,它就成为了手机市场上的佼佼者。
现在,我们处于快速迭代硬件的过程中,不断探索和应用不同的方法,使硬件逐渐成熟,并进行所有必要的改进。回顾我们的第一代产品(Figure 01),主要任务是确保整体架构的正确性。工程系统的细节至关重要,比如电池的能量来源是什么?是液压驱动还是电池供电?电池的化学成分和类型如何选择?如何处理电池的热管理问题?这些问题仅仅是关于电池本身的,而整个系统还涉及许多其他方面。
Figure 02的目标是打造一个功能完备的机器人,集成所有必要的系统,无论这些系统是我们自主研发的还是外购的,机器人都必须能正常工作。我们制造了机器人的大部分组件,包括固件、嵌入式系统、控制软件、机载硬件系统、执行器、电子设备、线路、电池系统、摄像头和传感器等。因此,Figure 02的功能已经基本完善,硬件部分达到了我们的预期。我们下一步的重点是如何将制造成本降低一个数量级。
主持人:你曾说过:“未来每个人都将拥有一个人形机器人,机器人劳动力将成为可选项。”这是一个相当引人深思的观点。
Brett:我们花了一年的时间研究如何降低制造成本。在对整个物料清单成本进行分析后,我们列出了约1000个零件的清单,然后逐项分析,无论是自行制造还是外购。我们发现,几乎所有的消费设备的价格都与其制造量相关。因此,降低成本唯一的方法就是提高产量。在未来,随着产量的增加,机器人成本可以降到每台设备低于2万美元,甚至更加便宜。
02
机器人会比汽车或手机更重要
主持人:记得我们第一次交谈时,你说过一些当时听起来很震惊但现在却很有道理的话。你曾预测到2040年,市场上可能会有多达100亿个人形机器人。你还坚持这个看法吗?
Brett:如果机器人能够胜任人类所能做的所有事情,也许会比汽车或手机更重要。因为它可以承担你不想整天做的工作,比如遛狗、泡咖啡、洗衣服,甚至回家整理孩子的玩具等。我可以让机器人每天花两三个小时来整理孩子的玩具,这完全没问题,它就像个不知疲倦的工人。
主持人:据我了解,Figure的使命是通过尖端的人工智能技术来拓展人类的能力边界。你是否将Figure定位为一家人工智能公司?
Brett:我们确实将自己视为一家专注于极限人工智能的公司,而极限人工智能恰好与机器人技术紧密相连。从更广阔的视角来看,我们在实现使命的过程中所遇到的各种挑战,大多都与人工智能的问题有关。Figure的员工有个共同的梦想,那就是有朝一日能看到这些机器人在全球范围内从事重要的工作。这对于人类来说是真正的需求,有助于降低商品和服务的成本,进而有望带来一个物质充裕的世界。我相信,这将帮助我们空余出大量时间,让我们能够去追求自己真正热爱的事情。
主持人:在之前的访谈中,你曾谈到机器人如何实现一个富足的时代。你对于机器人如何引领我们进入这样一个时代有何具体的想法?你能描绘一下这个时代的景象吗?你所说的“富足时代”具体是指什么?
Brett:人形机器人的独特之处在于,它们能够直接融入我们的现实世界。你可以直接将机器人投入到劳动力市场中。
如今的制造业在很大程度上,可以被看作是由机器和人类共同协作完成的。如果我们能够让机器人实现人类级别的制造能力,那么理论上,我们也可以让机器人来制造机器人。这些机器人可以被派遣到世界各地的各个工作岗位上。那么,这项工作的成本也就主要为租用机器人以及土地的使用成本。
因此,你可以通过机器人创造一个世界,在这个世界里,商品和服务的价格趋近于零,而GDP则会飙升到一个难以想象的高度,你可以得到你想要的任何东西,而这些东西对于每个人来说都是负担得起的。
主持人:你认为是否存在一些工作是机器人永远无法承担的?
Brett:随着时间的推移,数字和物理智能机器人将能够胜任越来越多人类擅长的工作。在过去几个世纪里我们已经通过技术的发展看到了这一趋势,但现在这一发展曲线正在加速,尤其是在大型语言模型领域,这种加速度几乎朝着我们无法想象的程度发展。
03
人工智能已成熟到可在现实世界中进行部署
主持人:我认为最值得关注的新闻是你们获得的融资——你们从OpenAI、微软、亚马逊和NVIDIA筹集了数亿美元的资金。
Brett:是的,我们以26亿美元的估值筹集了6.75亿美元。这笔资金将使我们能够迈出下一步——将这些机器人推向商业化。接下来的重大挑战是:如何让这些机器人真正融入劳动力队伍,并每天都能正常工作。
事实上,目前我们拥有的现金远超我们的需求。我们有像OpenAI这样的优秀合作伙伴帮助我们建立模型、有微软这样的公司帮助我们进行训练,NVIDIA则在GPU硬件和其他模拟工作上给予了大力支持。
主持人:你是否觉得,当前人工智能的发展状态和强大的计算能力,是你们项目能够实现的必要条件?毕竟,机器人技术已经被讨论了超过半个世纪,我在学生时代也曾亲手制作过机器人,但那与真正的机器人相差甚远。
Brett:现在的情况与以往大不相同。整个人工智能生态系统已经发生了翻天覆地的变化。人工智能不仅仅是模型那么简单,它还包括了训练、推理和部署所需的一整套基础设施,比如支持大规模模仿、强化的深度学习算法。
人工智能已经成熟到了可以在现实世界中部署的程度。上个月,我刚刚体验了Waymo的自动驾驶服务,那种感觉真的太特别了。
而且,近10年来的硬件发展水平也起到了关键作用。10年前,最先进的人形机器人大多也只是使用了液压系统,那些系统压力高达3000PSI,液压油到处渗漏,与人共存几乎是不可能的。因此,即使10年前有人工智能,也未必能构建出像现在这样高效的机电系统。
主持人:你最初是如何与OpenAI建立联系的?这是个重要的转折点。
Brett:几年前,我有幸认识了Sam,并逐渐建立了深厚的友谊。他们最终决定重新涉足机器人领域,特别是在人工智能和实体化系统方面。现在,我们正在为机器人开发下一代人工智能模型,OpenAI在这方面给予了巨大的支持。我认为OpenAI是全球范围内视觉模型的最佳实现者。
主持人:有些观点认为,除非我们能将人工智能具身化,让它们理解并探索宇宙,否则我们无法实现通用人工智能(AGI)。还有一种观点认为,在实现AGI的过程中,我们可能会遇到数据瓶颈,而人形机器人则是一种收集大量数据、帮助塑造未来模型的工具。
Brett:越来越明显的是,某种形式的实体行动对于我们在智能方面的下一步发展是非常重要的。无论是称之为高级人工智能、AGI,还是其他什么,这都是我们试图达到的目标,即如何将智能行动输出到世界中并做一些有意义的事情。因此,我们在人工智能方面的大部分重点都集中在这个主题上,以及如何使其尽可能具有可扩展性和可推广性。
主持人:当你开始这个项目时,多模态模型还未出现。你和Sam是否讨论过未来可能发生的事情?
Brett:我们取得的最大突破之一是拥有了大型语言模型,更具体地说,是视觉语言模型,这为我们在机器人技术领域提供了语义基础,这意味着未来机器人能够理解你说的每一句话。
主持人:你的意思是,未来我们与机器人的正常互动将像与人说话一样自然。比如你说:“你能帮我拿那个吗?”然后它会问:“你想让我拿什么?”接着你指着某个物品说:“那边的东西。”它就能理解你指的是订书机还是水瓶。因此,它具备背景知识、几何知识以及位置感知能力?
Brett:是的,今天,这一切都已经成为现实。机器人不仅仅能理解这些,还能超越这些因素,比如考虑到神经网络权重、塑料瓶的材料、大致的质量特性和摩擦特性,以及它如何抓住物体的感觉。所有这些都在它的计算范围内。