大厂竞逐自动驾驶云:先定数据合规,后谋智驾服务

  文/周雄飞

  现在买新能源汽车,最看重什么?

  对于这个问题,一些消费者对连线出行表示,车辆的智能化已成为他们购车考量的重要指标。

  目前,新能源汽车行业已从电动化向智能化转变,因此自动驾驶技术成为现阶段车企们重点布局的领域。

  为了提升在自动驾驶方面的实力,新能源车企们通过在车上搭载更多的感知硬件、更大算力的计算平台,达到对环境的更好感知。自动驾驶企业们也都推出了Robotaxi等业务,来获取更多的数据,训练自动驾驶算法的迭代。

  在这样的背景下,车企和自动驾驶企业产生的数据越来越多,数据如何储存、数据如何保证不会泄露、怎么保证数据的合规等问题也随之出现。

  针对这些问题,百度相较于行业率先拿到了高精地图的甲级资质,实现了高精地图数据的确权合规,并基于此建立了自动驾驶专有云,实现自动驾驶数据的闭环合规。百度之后,华为、阿里和腾讯等大厂也纷纷布局自动驾驶云业务。

  在解决好数据储存、合规问题后,如何用好这些数据,也成为大厂和车企们继续思考的问题。

  不可否认,自动驾驶算法想要实现更新和迭代,就需要被处理和标定好的数据来“喂养”训练。为此,以百度为代表的大厂们,在自动驾驶云的基础上还加入了对数据的标注、仿真和训练等功能,并把成熟的方案下放给车企们,帮助车企实现自动驾驶功能的落地。

  自动驾驶数据“上云”,对于自动驾驶行业发展是新的一步,也是关键一步。

  1、数据合规,重中之重

  自动驾驶战场,目前已是硝烟弥漫。

  近些年,蔚来、小鹏和理想等新能源车企,都已推出各自的自动辅助驾驶或智能驾驶功能,并把这一功能作为自身产品售卖时的主要卖点,他们竭尽全力在自动驾驶方面发力和布局。

  先从硬件方面来看,激光雷达目前已成为新能源车企产品的标配硬件,蔚来ET7和ET5搭载了1颗,小鹏G9、集度Robo-01探月版搭载了2颗,沙龙品牌甚至在机甲龙车型上搭载了4颗。

  感知硬件内卷的同时,也有一些车企更加注重自动驾驶算法的能力。

  在今年10月初的特斯拉AI Day上,特斯拉向外界展示了其在FSD上的最新进展,在获取数据后通过神经网络训练算法,让车辆可以更好地对外界环境做出判断。

  除了新能源车企之外,很多自动驾驶公司,也在积极布局各自的自动驾驶业务,比如百度、文远知行、小马智行等公司,在国内一线城市中都已推出Robotaxi业务,在日常上路运营的过程中积累路测数据,并拿这些数据训练自身的自动驾驶算法。

  百度Apollo Robotaxi运营车辆,图源百度Apollo官微

  随着布局自动驾驶领域的玩家越来越多,一些问题也随之暴露出来。

  新能源汽车行业向智能化快速奔跑,以至于新能源汽车也被业内视为下一代智能终端。

  要使新能源汽车这个智能终端运作起来,数据是不可或缺的要素,数据合规也随之成为汽车行业的强监管重点之一。“智能操作系统将成为新能源汽车的第二发动机,而数据则是新燃料。”阿里巴巴技术委员会主任委员王坚曾这样公开表示。

  就以自动辅助驾驶场景来看,据全球数据机构Garner统计,现今一辆具备自动辅助驾驶功能的车辆每天至少会产生4TB的数据,按照“蔚小理”这样月销过万辆的车企来算,一年所产生的数据总量就会达到ZB级别(10亿TB约等于1ZB),车企所面临的数据合规压力可想而知。

  数据指数级增长的同时,汽车数据的安全性、合规性成为行业亟待解决的重点问题。

  “新能源汽车上的毫米波雷达、激光雷达等传感器,可以不断扫描路面环境数据以及高精度地图等重要地理位置信息,这些数据如果泄露将在一定程度上威胁国家安全。”国家工业信息安全发展研究中心所长黄鹏这样认为。

  中国电子信息产业发展研究院副总工程师安晖提出了他的担忧,因为通过检测发现,有将近45%的车辆存在未经授权访问敏感数据的风险,这些数据不仅包括道路环境数据,也包括行人个人信息数据。在国家相关政策及行业标准下,数据怎么采,怎么用,如何保障合规,让这些数据“敢采、敢用、用得好”成为重中之重。

  数据风险,源于很多新能源汽车上都装有激光雷达等高精度感知硬件,在车辆开启自动辅助驾驶功能后,这些感知硬件就会对环境信息进行探测并记录,但这些车辆在本质上并不具备测绘资质。

  为了避免这个风险,数据合规就成了守护汽车数据的关键,车企们对此的需求也越来越强烈,第三方服务商则开始提供相应的服务,满足智能汽车、自动驾驶数据采集安全合规要求。

  2、数据合规探索:国家带头,大厂跟进

  对于智能汽车数据的安全和合规管理,我国政府很早就开始探索。

  早在2019年6月,由中国汽车工业协会牵头,协同国内多部门和机构参与制定的《智能网联汽车信息安全评价测试技术规范(征求意见稿)》(以下简称“规范”)正式发布。该规范成为了国内首个智能网联汽车的数据安全测评标准。

  国家也在积极探索数据合规运行监管之路。今年八月底,自然资源部发布《关于促进智能网联汽车发展维护测绘地理信息安全的通知》,对智能网联汽车的测绘主体和测绘活动的开展提出明确要求。

  《关于促进智能网联汽车发展维护测绘地理信息安全的通知》部分细则,截图自国家自然资源部官网

  在政府的引领带动下,一些大厂紧随其后,在智能汽车数据合规方面开始了探索。

  这其中百度作为国内率先在自动驾驶领域发力的企业,走在保障智能汽车数据合规的前列。早在2003年,就成立了百度智图,而且很快拿到了高精地图甲级测绘资质,成为国内率先拿到这一资质、并实现了数据确权环节合规的大厂。

  这之后,百度继续在智能汽车数据合规上发力。就拿上文所述的规范为例,就是百度Apollo等国内众多机构配合中国汽车工业协会制定的。

  除此之外,百度、华为等大厂也开始思考如何确保自动辅助驾驶软硬件所产生数据的合规性。要实现这一目标,这些大厂给出的答案是——让数据“上云”。

  “自动驾驶技术在快速发展,从成本层面和数据合规层面考虑,传统的数据中心已经无法适应行业发展,‘上云’是必然的选择。”智能汽车数据工程师王兵对连线出行表示。

  2012年,百度推出了云数据服务,而在那时百度也已开始向自动驾驶领域发力,由此两大业务不谋而合结合在一起,百度也走上了探索数据云端储存合规的道路。

  2017年,经过五年的布局和积累,基于高精地图的多年资质授权、Apollo数据合规流传和专有云数据存储的基础,百度组建了专门的团队,进一步对自动驾驶相关数据的合规进行保障工作。

  百度之后,华为也很快把触手伸向了智能汽车数据上云的领域。2019年,华为发布了名为“八爪鱼”的自动驾驶云服务,基于华为云底座,车企的车辆数据可以快速传入云端进行储存,并保证数据的合规性。

  时间来到今年,大厂们在数据合规方面的布局变得更多。

  今年4月,阿里巴巴基于斑马智行和阿里云数据上云的实践经验,针对智能汽车数据合规推出了车联网安全方案,这一方案通过对云端数据的监测,实现对云端自动驾驶数据合规的防控。

  紧接着,腾讯在6月底发布了一体化汽车安全方案,该方案基于车企数据上自动驾驶云和依赖高精地图的基础,通过在采集、上传等阶段建立监控体系,保障云端、车端和移动端等端口数据的安全和合规。

  本月初,百度也基于此前在自动驾驶数据合规方面的布局,对于自身自动驾驶云进行了升级,预发布了自动驾驶云2.0。

  据介绍,百度通过联合自动驾驶云和百度智图,践行“原始数据不出车、测绘数据不出云、测绘成果不关联、资质图商全管控”的合规思路,凭借这一布局,百度也在全行业率先建立了从高精地图资质、Robotaxi到量产车ANP2.0、ANP3.0全场景自动驾驶技术、车端落地安全认证等全流程数据闭环合规体系。

  “数据上云后,相比于储存在车辆终端或者车企服务器,会更加灵活,一方面便于对数据进行分类和分级,另一方面也促进了车企与百度等服务商的交流和配合,促进自动驾驶等领域的数据实现安全、合规和使用。”某新能源汽车技术研究院院长张翔对连线出行表示。

  当自动驾驶数据合规这一关键需求得到保障后,很多人就开始思考数据上云后的更多可能性。

  3、自动驾驶云,不只是保障数据合规

  如果说如何更快地获得大量数据,是自动驾驶行业玩家上半场主要做的工作,那么如何用好数据,则是各个玩家需要思考的问题。

  对于新能源车企而言,自动驾驶技术的发展已经从之前“有没有”的阶段,过渡到现在“好不好用”的阶段。对于这点,可以从消费者购车决策过程中明显看到。

  “在前些年选择新能源汽车产品时,我会看一个产品是否有自动辅助驾驶功能,但到了这两年,我会更加关注一款产品自动辅助驾驶是否好用和靠谱,毕竟现在主流的车型都具有这一功能。”一位新能源车主对连线出行表示。

  要实现自动辅助驾驶功能的好用,离不开感知模型训练和仿真测试两大体系的支持。

  感知模型训练,简单说就是把储存在云端的数据拿出来进行处理和筛选,与此同时从这些数据中挑出一些corner case(极端场景),再把这些数据进行标注,让人工智能系统认识这些数据,最后形成模型供算法进行机器学习。

  而这其中,数据标注需要把感知硬件捕捉到的数据,比如车辆、路牌、路灯、指示灯和行人等信息进行分类标注,由此这一环节也会耗时最久、且精度要求也最高。

  “以50万段训练数据Clips(最小标注单元),10亿个物体为例,采用全人工标注需2000人一年的时间。”小鹏汽车副总裁吴新宙在1024科技日上公开说道。

  与数据标注相似的是,仿真测试也成为自动驾驶技术研发过程中耗时较长的另一环节。这也是因为场景库无法覆盖到更多极端场景,同时仿真测试也存在与实车路测出现偏差大的情况。

  针对这些问题,目前业内公认可以依靠“上云”来解决。“针对自动驾驶数据标注这样体量大、算法精度要求高、训练效率要求快的工作,自动驾驶云相比于线下人工标注,基于更强的算力和智能化,让数据标注可以更加具有效率。”王兵对连线出行表示。

自动驾驶数据标注

  王兵还认为,自动驾驶云也可以构建开放的场景库,不仅让仿真训练更全面,同时也能达到仿真训练的多线程执行,进一步提高整体的训练效率,从而让自动驾驶算法实现快速迭代。

  要建立这样一套自动驾驶云,对于大多还未实现盈利的新能源车企来说,较为困难。但对于百度、华为等大厂来说,则是可以做的事情,它们也早已布局了各自的自动驾驶云服务。

  以百度自动驾驶云2.0为例,其基于高精地图合规资质和专有云等基础设施,可以实现对自动驾驶研发的全流程覆盖,包括采集、存储、标注、训练、仿真、管理全流程,可以保证全栈数据闭环合规的同时,还能让整个流程更有效率。

  当自动驾驶云把数据模型训练好后,下一步就是交付给车企,以便帮助一些车企来构建自身的自动驾驶能力。而对于车企而言,这些交付的模型方案是否灵活,成为与这些大厂合作的关键。

  这方面,百度也走到了行业前列。

  根据百度自动驾驶首席产品架构师姚发亮向连线出行介绍,百度自动驾驶云2.0向车企交付的不仅是工具链,更是交付了整个平台的能力,车企可以依赖整个自动驾驶云的能力来研发它们自己的智驾能力。

  换句话说,百度自动驾驶云对车企的支持不仅做到了“授人以鱼”,与此同时也实现了“授人以渔”。

  百度能做到这些,得益于在自动驾驶技术领域的10多年实践积累,同时它也是全国19家拥有导航电子地图制作甲级测绘资质企业之一,在信息安全、云计算安全和可信云服务等方面,都具有国家相关部门颁发的认证,可以给予车企合规的数据来研发自动驾驶算法。

  目前,百度Apollo自动驾驶路测里程累计已超过3600万公里,并且对合规测绘数据的采传存管用在百度地图上均有大量实践,可以给予车企“一个中心、三重防护”的解决方案,实现既合规又高效的合作。

  “大厂们在自动驾驶云上持续发力,会推动整个行业建立相关数据合规的标准,同时也会推动整个自动驾驶行业的向前发展。”张翔这样说道。

  可预见的是,随着新能源汽车步入下半场,自动驾驶相关的数据会越来越多,自动驾驶云领域的战火或许会燃得更旺一些。与此同时,对于智能汽车数据的合规保障也将会越来越完善。

  (应受访者要求,文中王兵为化名。)


董秘研修班
整合百位上市公司董秘导师,10年培养 5000+ 董秘实操人才
马上查看详情
董秘研修班
整合百位上市公司董秘导师,10年培养 5000+ 董秘实操人才