graviti
产品公开数据集应用市场解决方案知识库关于我们

数据如何帮助提高自动驾驶安全?看格物钛等行业大咖热议

发布于2021-09-30

自动驾驶已然成为黄金的热门赛道,但也面临着技术、安全、伦理等多方面的诸多争议。

不久前,31岁的企业家在驾驶带有“自动驾驶”功能汽车途中发生事故,不幸逝世。与此同时,特斯拉辅助驾驶系统Autopilot也面临来自美国监管机构的调查,加上此前上海车展车主维权事件的舆论持续发酵,一时间自动驾驶安全性成为大众关注和讨论的焦点。

在近期举办的第11届陆家嘴产业金融论坛上,格物钛COO吴琼婧作为主持人,与中海庭、楚航科技、高合汽车、尚颀投资、劲邦资本等自动驾驶创新企业及产业资本的嘉宾,对"数据如何帮助提高自动驾驶安全"这一话题进行了深入探讨。与会嘉宾普遍提及数据的商业价值,并认为数据开放具有重要意义,倡导有条件的、逐步的、有相应机制和标准的数据开放,推动安全前提下的数据开放与车路协同,对推动自动驾驶技术落地有关键作用。


无人驾驶落地面临的挑战是什么?

中海庭CEO刘奋认为当前无人驾驶落地所面临的挑战是多方面的,首先是技术上场景和数据的匹配度,其次是政策法规的制定,以及在无人驾驶落地过程中商业模式和产业边界的重构。尚颀资本股权投资部董事总经理胡哲俊则认为无人驾驶最大的挑战仍然来自于技术,很多自动驾驶车辆在路上因为一些低级错误发生事故,从侧面说明自动驾驶技术还存在一定缺陷,尚未成熟到可以实现大规模产业化让消费者放心使用的程度,在软件、数据以及硬件方面还存在诸多技术难点需要去攻克。        
劲邦资本合伙人王荣进认为无人驾驶落地的过程应该是渐进式的。在不同场景下无人驾驶商业化落地的时间有早有晚,业内普遍认为无人驾驶会在矿区、港口、园区等特定场景率先落地,从商业角度来看这是个机器取代人的过程,智能化改造所带来的效能提升有多显著会是一个非常重要的考量点。

而在楚航科技高级顾问浦维达教授看来自动驾驶是一个庞大的系统性工程,需要循序渐进、各要素间相互协作来提升整体水平。在此过程中最值得关注的是安全,一是汽车自身运行的安全性,另一个就是敏感信息的数据安全

高合汽车CTO马克·斯坦顿提出了一个引人深思的问题:人工智能下的无人车到底多安全才能被大众接受?这是一个在政策法规层面需要继续磨合、在技术层面需要继续探索、在公众接受度层面需要提高才能被解决的问题。无人车商业化落地还有很长的路要走,在往前走的过程中,如何高效、规模化地找到更多实际有效的场景数据会是很多公司下一个阶段面临的挑战。


未来无人车落地技术路线:单车智能加智能网联

目前无人驾驶落地存在两种技术思路,一种是单车智能,另一种是智能网联。

胡哲俊认为单车智能加智能网联是最适合我国国情的发展策略,我国在人口密度、通信技术和资源上都具备优势,政府的执行力强,从公共交通的层面去推车路协同相对来说阻力更小。

马克·斯坦顿深以为然,他表示虽然业界大家都在讨论复杂场景、稀缺场景,但是这些场景的数据需要丰富到什么程度,达到怎样的规模才是我们认为够了的数据量,这是一个需要被讨论的问题。在关注单车智能的同时,也不应该忽视智能网联车路协同给无人车安全性提供的巨大价值,车路协同会是未来无人驾驶落地非常好的契机。


无人驾驶赛道兵家必争之地:数据

为避免在硬件上与传统海外巨头产生较强的正面竞争,无人驾驶的软件能力成为中国创新企业差异化竞争弯道超车的突破口。

王荣进表示汽车产业投资人现阶段会更加关注发展潜力更大的自动驾驶软件公司,而软件的核心是算法和高质量数据。目前无人驾驶商业模式正在发生深刻变化,数据和算法紧密结合的做法逐渐得到市场的认可。无论是视觉还是雷达方案,本质上都是一整套服务于汽车工业的软件解决方案,而数据在其中扮演的角色是促进算法持续迭代的基础设施。

胡哲俊发现数据对车厂来说越来越重要了,特斯拉最大的竞争力不在于算法,而在于每天路上跑的车和这些车贡献的数据,持续造血获取海量数据的能力为特斯拉构建了坚固的护城河,通过这些数据可以不断优化自动驾驶算法和模型,进一步提升企业竞争力。国内的自动驾驶公司大多都是轻资产运作的软件公司,很难运营起庞大的车队去持续获取大量数据,这也是国内自动驾驶行业发展的痛点之一。

即便找到了数据获取的途径,数据的长尾效应也一直困扰着自动驾驶研发团队,如何高效获取和使用2%稀缺复杂场景下的高质量数据始终是个难题。

王荣进提出可以通过一些AI的方法,或者模拟仿真来丰富场景库去做算法优化,这是非特斯拉系的企业可以考虑的方向。这与轻舟智航联合创始人兼CEO于骞此前提出的“仿真测试是通向自动驾驶的必由之路”这一观点不谋而合,于骞认为自动驾驶对测试里程的要求非常高,只有大规模的路测才能保障真正的安全。而实际上稀缺场景的路测数据量是十分有限的,需要创造一种虚拟环境把现有数据的价值重新发挥出来,验证算法的修改、系统的变化是否安全可靠,加速开发流程,提升路测效率。

格物钛COO吴琼婧也分享了格物钛在汽车行业的解决方案,帮助车企的算法团队快速找到高质量数据,创造更丰富的场景库。无人驾驶行业每天会采集大量行车数据,一辆数据采集车每天会采集10TB的数据,100台车就是PB级的数据量。吴琼婧指出长期路侧采集的成本很高,如果能在海量的数据中快速找到符合需求的复杂场景数据进入模型训练阶段,并且把采集的真实数据转化成仿真场景库,在仿真场景库中做调优,例如把旁边并线的车速提高或者降低15%、或调整角度。这种做法可以仿真创造出更多的数据,来替代高成本的数据采集工作,这一方面的解决方案都可以用数据平台的方式来实现。


破局稀缺场景的另一种可能:数据开放

除了增加用户端数据获取的渠道和仿真测试,胡哲俊提出了另一种可能性:数据集的共享,通过车厂、自动驾驶公司之间的数据共享去丰富各自的数据库和数据集,进一步优化算法,提高安全性。

浦维达教授频频点头,他认为数据的安全利用是很有商业价值的。现在在马路上各家车企积累的上百万公里的行驶数据,是通过很多辆车叠加起来的,单一车辆的行驶里程和区域也是相对有限的。这个时候就需要大家把数据放在一个公共平台上进行共享、交流,甚至进行交易。小企业或许没有太多人力物力投入到高成本的采集数据运营工作中,这些都可以通过购买服务来解决。综合而言,这些数据是可以不断复用产生规模效益的,无论是政府还是行业组织都应该倡导这种做法。

刘奋也对数据开放抱有持坚定不移的支持态度,必须承认汽车工业还是相当保守的,数据掌握在每个车企手中,它的流动性和价值被远远低估了。如果一旦数据能被开放出来,一个超过所有人想象力的商业时代就真的来临了,在这个让人热血沸腾的“数智化”时代,数据开放会极大促进社会运行效率。

王荣进认为数据共享是有条件的,应该视具体情况来决定是否开放。带有一定公共属性的、和交通路况相关的数据是应该拿出来被积极共享的,但是用户和单车的数据可能车企还会有所保留。胡哲俊进一步补充道:数据应当是在特定生态圈里有限度地被共享,而不是完全面向全社会的、不加限制的开放。这种不加限制的数据共享可能会带来负面的安全隐患。数据具体应该以什么样的形式被共享,会受到怎样的限制是需要整个行业的参与方进一步深入研究的。

格物钛看到了数据开放的重要性也认可数据开放应当有条件地、逐步地、有一套机制和标准地来向社会做倡导。在今年世界人工智能大会上,格物钛和上海白玉兰开源开放研究院共同发布了《木兰-白玉兰开放数据许可协议》,希望从法律层面提供一种“社区行为标准”去加速数据开放共享。

8月一场自动驾驶系统造成的车祸引发了全社会对自动驾驶安全性的担忧,然而就在一周后的特斯拉AI日上,特斯拉发布了一款人形机器人,开始把在汽车行业里获得的软件持续迭代方法用于布局高阶人工智能算法突破,重新点燃了外界对单车智能完全市场化的憧憬与向往。

道阻且长,生而又有幸。

试想未来在全球范围内自动驾驶的渗透率达到10%甚至15%以上,所有的技术问题会从汽车工业的智能网联化拓展到智慧交通的运营管理,自动驾驶将重塑城市形态与生活方式,商业模式和产业边界会经历重构,全新的规则体系会应运而生,身处于这样一个变革时代值得每一个人去证明、实践自己,而现在所有自动驾驶赛道玩家正在做的就是提前布局规则,加速这一时代的到来。

作为一家专注于打造人工智能新型基础设施的初创企业,格物钛正在以数据为中心的开发方式,向全球AI创新团队、前沿高校实验室和机器学习开发者社区提供数据平台支持,助力自动驾驶安全发展。