自动驾驶开启云服务,看腾讯阿里百度华为如何跑马圈地?
一辆蔚来ET7有33个感应硬件。在驾驶辅助状态下,这些硬件每秒捕获的数据总量约为8GB,每小时将产生约28TB的数据。
假设一个ET7车主每周只使用辅助驾驶功能一个小时,一辆单车一年产生的数据量是1456TB,达到PB级别。
截至9月,蔚来ET7累计交付15,439辆。目前,这些车辆每年产生约2247万TB的数据。
那么,存储这些数据要花多少钱呢?
如果这些数据存储在可移动硬盘中:
一个20TB的移动硬盘至少要3000元,存储2247万TB的数据。需要112万个20T移动硬盘,采购成本超过33亿。
以上只是非常保守的估计。随着驾驶辅助功能的演进,收集的数据会越来越多,可用时间也会增加,汽车本身的数量也在不断增加,数据会迅速飙升到ZB(约10亿TB)级别。
对于自动驾驶赛道上的每个玩家来说,动辄数十亿的投资就是毛毛雨。因为这些数据是赢得未来的重要财富。
但是这么庞大的数据库,将来还会更大,如何有效的存储,更好的利用呢?“云”被放在了前所未有的重要位置。
广汽集团董事长曾庆红曾说,“只有掌握了数据,才能有机增长。自动驾驶云数据中心是实现算法场景演进叠加的有力保障,也是广汽开始布局的关键赛道。”
哪里有需求,哪里就有生意。
腾讯、华为、百度、阿里等在云计算领域深耕多年的互联网巨头,正在一片新的土地上鏖战。
而车企作为原住民,很多能力建设需要人工之手,但也不希望看到外人篡夺主人的角色.
而一个跑马圈地的故事正在云端上演。
“一个成型的数据中心,硬件至少要上亿,这还不算运维费用。没有一个一定规模的企业承担不起这个成本。”某汽车集团智能科技公司运维总监说。
对于研发自动驾驶的企业来说,R&D前期的测试车辆虽然在高强度运行,但整体数据规模并不是很大,存储和计算能力需求可以通过自建数据中心来支撑。
甚至在一些小型Robotaxi公司,也可以只使用原来的硬盘拷贝方式,返回全部数据量,然后进行数据挖掘。
但是当自动驾驶从0-1的技术验证阶段到1-N的商业落地阶段,如前所述,数据会有几何级的爆发式增长。
如果想通过硬盘拷贝和自建机房继续存储数据,会带来难以承受的成本。除了价格昂贵,更致命的缺陷是传统数据中心缺乏可扩展性,难以满足超出本地计算能力的意外需求。临时采购或扩充服务器会拖累R&D进度,之后资源会闲置。
因此,“上云”成为自动驾驶从R&D走向商用的必经之路。
形象地说,“云”指的是通过互联网访问的服务器,以及在这些服务器上运行的软件和数据库。
服务器分布在世界各地的数据中心。通过使用云计算,用户不必管理物理服务器或在自己的机器上运行软件应用程序。
云服务通常有三个层次:软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)。
腾讯声称,其自动驾驶云平台提供的数据存储方案与传统存储方式相比,可以降低至少50%的存储成本。
当然,存储数据只是完成了数据驱动过程的第一步,即Iaas服务水平。
云服务提供商可以提供数倍于本地的计算能力,并且有在云端训练复杂神经网络模型的经验。结合深度学习,它们可以提高自动标注的能力,优化标注算法的效率和精度,降低数据处理的成本。
根据安永(中国)企业咨询有限公司与华为合作撰写的【0x9A8B】。
依托更高的计算能力和更多的经验积累,汽车云服务数据综合处理效率可提升10倍以上,成本比人工降低50%。
此外,云服务提供商除了提供增量数据标记服务外,往往还会为客户提供海量、迭代的标记对象,方便客户利用现有数据快速发展业务。
通过数据收集和标注,获得有价值的数据。这些数据的使用依赖于模拟模型的训练和测试。
仿真的效率很大程度上决定了算法的迭代速度,也影响了全自动驾驶的落地过程。
腾讯自动驾驶模拟业务总监孙赤田表示,“目前自动驾驶算法已经能够处理大部分交通场景。真正的挑战在于少数的角落案例。”
解决拐角案例,业内有一个广为流传的观点:一个自动驾驶系统至少需要100亿英里的测试,其安全性能才能满足量产应用的条件。
这个距离相当于地球到太阳的50多次往返。从成本和时间上来说,没有一个企业可以通过路试跑完这个测试里程。
但是,模拟系统可以基于真实世界的数据和物理规律,为自动驾驶汽车训练构建一个平行世界,大大降低了测试成本。
但在本地模拟运行时,场景构建完全依赖于自行采集的数据,覆盖面往往不足。另外,无法实现高并发的并行仿真测试,场景运行效率无法满足长测试里程要求。穆赛科技总经理何峰表示:“一个算法或者一套传感器解决方案,可能需要几十万甚至上千万的测试场景来验证。如果单机测试,需要几个月的运行时间,无法满足自动驾驶的快速迭代开发要求。”
通过云仿真,在强大计算能力的支持下,可以并行运行上千个仿真场景,从而实现高并发测试,快速得到测试结果,提高数倍的算法迭代效率。
“相比堆硬件和拼算法,云‘滚入’更有可能成为赢家。小鹏的腾飞未来很可能成为一只‘大猫’。”一位就职于新势力的软件工程师这样描述云对于自动驾驶的重要性。
一般来说,自动驾驶软件开发的数据驱动流程是:数据采集、数据存储、数据预处理、数据挖掘、仿真模型训练和测试、部署和发布。
没有云,理论上这套流程也可以贯穿。
但正如Panosim首席执行官李向明所说:“所有的商业和物理世界本身都存在,云就像一个‘插件’,为自动驾驶的落地打开了一条快车道。”
从某种程度上来说,小鹏最近率先登陆NGP这座城市,也促成了这一“外挂”。
今年8月,阿里云还“震撼”了与Xpeng Motors共同建设的智能计算中心。基于计算能力可以达到600PFLOPS(每秒60亿次浮点运算),计划将Xpeng Motors的自动驾驶训练速度提升近170倍。
其实说到自动驾驶云,应该先提到特斯拉。
特斯拉自主研发的超级计算机Dojo经过至少5年的准备,终于在2021年正式发布,最终实现了1.8EFLOPS(每秒1800亿次浮点运算)。它可以利用海量视频数据进行无监督的自动驾驶标记和训练。
此外,特斯拉还建立了一个拥有60亿个标签和近2000万公里虚拟道路的库,用于算法训练。
随着Dojo的引入,马斯克有信心进一步简化感知硬件。今年10月,伴随着Model 3和Model Y上取消超声波雷达的消息,特斯拉也变成了完全纯视觉派。
特斯拉还计划在未来通过“exapod”集群部署Dojo,每个集群由10个机柜组成。
在为特斯拉的自动驾驶汽车转换AI模型后,其处理能力将接近每秒8万亿次浮点运算,是目前计算能力的4倍以上。
根据马斯克的计划,第一台Dojo exapod将于2023年第一季度部署。
有了参与FSD beta测试的160,000名用户生成的数据,Dojo exapod将使FSD发展得更快。当然,特斯拉本质上是一家软件公司,Dojo不仅仅是做自动驾驶服务的,还有擎天柱机器人,卫星链等等。
马斯克甚至认为Dojo可以和亚马逊的AWS相提并论。后者是世界上最全面、应用最广泛的云平台。
一座歪歪扭扭的建筑,马斯克和杰夫贝索斯(亚马逊集团董事会执行主席)一直没能处理好。他们争吵了十多年,经常在采访和社交媒体上挖苦对方。
自建私有云的好处是车企可以掌握核心数据和全流程算法的技术能力,更容易实现产品差异化。
但是像特斯拉这样努力的人不多,因为云是一个进入门槛很高的领域,跟造车一样高。构建私有云需要很长的时间周期和巨大的建设成本。
经济实力较强的车企通常会选择自建私有云来购买公有云的混合云架构。
作为推动自动驾驶在中国普及的先行者,小鹏选择了与阿里云合作建设自己的云计算中心,但对于图形数据仍会采用一些云计算和云存储服务。
继小鹏之后,今年10月,SAIC集团云计算数据中心项目落户郑州。根据规划,SAIC的云计算数据中心将按照2万台服务器的规模和互联网开源技术架构一次规划建设,为其智能出行、智能制造、智能驾驶发展赋能。
总的来说,相比于自建云计算中心,购买云服务提供商提供的公共云服务的方式其实更划算,也是大多数自动驾驶开发者的选择。
“开发者的核心能力在于算法研发和产品定义。作为一个算法训练工具,云应该尽可能基于SaaS。比如最好直接在云端准备丰富的标注数据、场景甚至训练模型,开箱即用。”上述软件工程师说。
一方面要专业,使用方便,另一方面要能实现底层解耦和自控。车企购买云服务也要多方面权衡和考虑。
因为云计算涉及到企业竞争中最关键的数据归属问题。
很多人应该还记得,在SAIC荣威第一代互联网模式普及之后,阿里和SAIC对车联网数据和技术资源的争夺,直接导致了车联网先行者斑马网络的内乱。
“就工具链的使用而言,单个供应商提供数据收集、注释和模拟等全栈工具链肯定是最高效的。但车企出于安全和独立的考虑,也希望在不同的环节选择不同的供应商,甚至想通过自研工具链提高在生态中的话语权。”某自动驾驶公司IT总监的话道出了车企的纠结。
微软、亚马逊、谷歌等国际巨头都在加速布局国内车载云市场。例如,8月,微软首次发布了基于微软智能云和智能边缘技术的中国汽车和移动出行整体解决方案。
但整体来看,国内的车载云市场还是以巴斯(百度、阿里、腾讯、华为)为主。
面对车企的需求和纠结,他们也在努力寻找合作的平衡点。
以腾讯为例。自2016年进入自动驾驶轨道以来,其发展方向已有多次调整。
2018年,腾讯先后在北京和深圳获得自动驾驶测试牌照。时任腾讯自动驾驶实验室负责人苏奎峰表示,要重点推动L3产品的落地。
显然,这个目标至今没有实现,腾讯也早早放弃了做完整解决方案的想法,将定位调整为自动驾驶开发的软件和服务提供商。
首先,专注于模拟业务。2019年,自动驾驶虚拟仿真平台TAD Sim推出,一年后迭代到2.0版本。
腾讯的虚拟仿真业务在长沙、襄阳、深圳等地的智能网联汽车试验场或示范区接到了一些订单,但在汽车企业却鲜有建树。
2021年,腾讯再次调整方向,推出自驾云平台。虚拟仿真成为工具链中的一环。同时,在云平台中集成了西门子工业软件、云测量数据等企业的工具和软件。
最终目标是在自动驾驶R&D数据驱动的每个流程中,提供开箱即用的便捷工具和服务.
用官方的话来说,就是让R&D的人事“落袋为安”。
云SaaS业务发展的相同思路也体现在华为的自动驾驶云服务“八达通”中。
早在2019年八达通发布时,华为就提出了在“0”的基础上,协助车企打造自动驾驶开发能力的口号。
为此,华为宣称在Octopus中内置了2000万帧标注数据集、20万个仿真场景库,以及完整的工具链和标注算法,让车企可以快速聚焦自动驾驶业务的核心价值。
相比前两者,百度和阿里更晚才高调发布自己的自驾车云服务。
今年9月,百度AI云推出了三款汽车云:覆盖R&D、生产和服务的集团云,覆盖自动驾驶和智能驾驶舱的网联云,覆盖工业协同和物流调度的供应链协同云。
可见百度已经把供应链和自动驾驶提升到了更高的地位。
此外,帮助小鹏刮起“旋风”的阿里,将在11月的云起大会上正式宣布其汽车云业务。
阿里云智能全球销售总裁蔡表示:“自动驾驶将是未来阿里云的三大支柱之一。”
值得注意的是,尽管不同的云品牌有不同的名称,但趋势是相似的:在SaaS服务的同时,为了消除车企对数据归属的顾虑,云服务商也在尝试将工具链解耦,分为数据、训练、仿真模块,不捆绑销售,用户可以随时更换,以保证车企的主导权。
公开资料显示,腾讯已先后与宝马、奔驰在自动驾驶云领域达成合作。
根据开放的合作协议,腾讯将帮助宝马建设自动驾驶高性能数据中心;和奔驰联合成立自动驾驶实验室,推动奔驰L3自动驾驶系统的国产化。
相比之下,到目前为止,还没有车企单独购买华为自动驾驶云服务的消息。然而,在与极狐和文杰等公司的合作中,这些服务大多是打包的。
但即使像华为那么强,你也需要考虑客户接受度。为此,八达通将为客户提供多种合作方案。
第一种是全包。华为负责开发和提供完整的量产解决方案;
后半包是华为开发的,客户可以自由配置一些参数;
第三种采购,华为提供自动驾驶开发工具链,客户自研,华为提供全套售后开发咨询服务。"
在阿里和小鹏成立之前,已经为路特斯、SAIC智机、Mimo智行、绞盘科技等企业的自动驾驶模型训练提供了计算能力和技术支持。
总的来说,大家都处于市场发展的初级阶段,但是自驾云的市场是广阔的,前景是光明的。让子弹飞一会儿,才能真正看清格局。