何小鹏说:到2025年,小鹏汽车花在算力上的钱,每年将超过10亿元。乌兰察布,国家“东数西算”的枢纽中心之一,这里分布着阿里、华为、苹果等众多公司的云计算数据中心。小鹏汽车与阿里云共建的自动驾驶智算中心——「扶摇」也落地于此。
按照官方的披露,扶摇的算力达到了600PFLOPS(每秒浮点运算60亿亿次),这是一个什么样的水平?我国最著名的超级计算机「神威·太湖之光」的持续算力是93PFLOPS。如果只看浮点运算次数这一个指标,「扶摇」相当于6.5个「神威·太湖之光」。扶摇”这个名字的寓意很好,双方选了这个名字,也是希望借助智算中心的强大算力,来完成“自动辅助驾驶”向“自动驾驶”目标的迈进。可能会有不少人无法理解,自动驾驶不是要靠车上的芯片么,云端的算力有意义吗?
其实绝大多数的自动驾驶在商业化时,都要经历3个阶段:即仿真测试、封闭道路测试、开放道路测试。而随着辅助驾驶从高速迈入城区,仿真训练的作用越发凸显,在自动驾驶算法的模型训练中,占据了非常重要的位置。在城市场景中,交通参与者的数量和种类成倍于高速场景。比如:穿越马路的行人、电动自行车;各式各样的交通指示灯、复杂模糊的道路标线,以及各种施工;同时,交通参与者的行为极难预测,如果只依靠道路的实际测试,很难在短时间内复现各类复杂场景。
于是,仿真训练出现了。它可以在短时间内,通过改变各种参数,来模拟大量的场景,以此来训练算法模型。这是一种既安全又高效的算法训练方式。按照自动驾驶行业的总结来说,仿真训练具备了:低成本、灵活性、可扩展、可衡量的优势。
拿成本举例,仿真的路测成本大约是实际路测成本的1%。而灵活性则是指,各种极端的corner case,仿真可以轻松大量复现,并确保安全性。
很多人都知道特斯拉发布了一款叫Dojo的芯片,但它并不是装在特斯拉车上的,而是用于特斯拉自动驾驶算法的训练芯片,而扶摇对于小鹏汽车的作用就等同于特斯拉的Dojo。
为什么会选择乌兰察布,而不是在小鹏的总部广州。为什么会选择阿里云,而不是自建数据中心?这就不得不提到我国的“东数西算”工程。它是指:通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,而乌兰察布就是8大数据枢纽之一。
电力对于数据中心来说极为关键,相比于东部发达地区,西部的电力充沛,且价格便宜。以乌兰察布为例,其电能主要来源于风电和光纤,是妥妥的绿能,同时乌兰察布全年的平均气温仅为5-7℃,对于数据中心的散热极为友好。
首先是阿里云的实力。根据Gartner 2021年全球云计算IaaS市场份额的统计。阿里云排名全球第三,亚太第一。
其次,则是小鹏汽车与阿里的渊源,何小鹏离开阿里巴巴的最后一个岗位就是在阿里云,他对于阿里云的发展再清楚不过。按照何小鹏的话来说:阿里云的稳定性和服务能力是最好的,阿里的技术能力为小鹏汽车提供了最好的效率和最低的成本。何小鹏回答:这不单单是算力、存储能力的合作,而是在软件和算法上,小鹏汽车和阿里云可以相互学习。
其实在模型训练中,通常会涉及到大量的视频、音频和多模融合,如何快速的检索到需要的场景,这其实是一个AI的综合能力,阿里和小鹏汽车在这方面有着紧密的合作,可以让效率最大化。
何小鹏说:小鹏汽车目前有三套数据闭环,很多人认为数据的能力是以深度学习为导向的,而实际上它还包括了人的因素,有时候人开车的判断会跟AI的仿真并不一致,这就会形成一些特殊案例。人和机器为什么不同,谁开的更好,这里面会有大量的对比,其实这就是仿真中对于规划能力的训练。有一种观点认为:自动驾驶中的感知、融合、定位、地图、控制属于开环系统,这些从算法和能力上容易解决。最难的是规划,且规划无法脱离仿真,是真正的闭环。
比如你的策略是激进还是保守的并入车道?如果没有大量的数据喂养,是很难建立准确模型的。而数据除了仿真,也包括了上面提到的各种案例,基于这一点你就不难理解:为什么路上跑的车越多,你的自动驾驶学习能力也会越强的道理。而智算中心的优势则在于,它形成了数据存储、AI深度训练学习、云与车端比对的一整套闭环链条。二十天之后,小鹏汽车将发布2022年二季度财报。在一季度财报中,小鹏汽车的高速NGP里程渗透率接近70%,在所有品牌中位列头部。而随着P5的大量交付,这个数据有望获得新的突破。
小鹏汽车智能化的下一个重要节点,是CNGP(城市NGP),如果顺利的话(政策法规),该功能将在今年四季度交付,届时小鹏汽车将成为全球唯二具备该能力的车企。而「扶摇」智算中心,将在这其中发挥关键性的作用。它也是未来,小鹏汽车从自动「辅助」驾驶,走向真正「自动驾驶」最重要的一张王牌。