火花谈|对话深圳自动驾驶智能研究中心副主任郝景山
发布时间 2024-04-08 13:36:49 12次浏览 人物 商业地产 楼宇经济 办公选址 产业园区

「编者按」

【深圳自动驾驶智能研究中心副主任郝景山,本科毕业于清华大学物理系,拥有超20年的新技术行业落地及商务拓展经验,行业经历覆盖交通监控、互联网金融、手机图像增强、安防智能摄像机、高级辅助驾驶、驾驶员监测、自动驾驶等多个领域。作为一名连续创业者,他曾是商汤科技的联合创始高管。】

智能化与电动化是汽车行业大趋势,也正在重塑人们的驾驶出行体验。2023年以来,AI大模型正在加速颠覆各行业,为智能汽车的未来发展带来更多可能,自动驾驶领域也面临着新机会和挑战。

深圳自动驾驶智能研究中心副主任郝景山,分享了对自动驾驶发展趋势的思考。他认为,自动驾驶领域要的是确定性,大模型会给行业带来新做法,但需要时间验证,是一个在途研究的领域。在他看来,在自动驾驶技术的加持下,中国的智能汽车将逐步升级并朝着“车路云一体化”的方向发展。

未来,郝景山和深圳自动驾驶智能研究中心将聚焦几方面的工作——引进香港科技大学等顶尖科研力量,攻克制约无人驾驶产业发展的关键技术问题;联合上下游产业链重点企业,构建无人驾驶完整生态链,深化粤港澳大湾区创新合作。

(深圳自动驾驶智能研究中心副主任郝景山)

「采访实录」(经整理)

01

自动驾驶领域的技术、产业和应用落地迎来新发展

《火花谈》:随着技术的不断发展和国家产业政策的推动,自动驾驶技术落地的状况和发展趋势?

郝景山:大家说到自动驾驶,经常会把几个词混淆。其实在自动驾驶领域中,Self Driving与Autonomous Driving有所区分。前者指完全无需司机的无人驾驶,后者则强调智能驾驶,即车辆具备自主意识。

经过这几年的发展,从2023年2月开始,自动驾驶技术从L2/L3/L4的分级逐步聚焦于L2+/L2++/L3,尤以L2+为发展重心。L2+指的是量产乘用车搭载ADAS高级辅助驾驶系统,中国市场年销量已达数千万辆。在L2++级别中,尽管车辆具备辅助驾驶功能,但事故责任仍归属于司机,法律要求司机在必要时必须接管车辆。

L3自动驾驶在特定时间和路段内,将事故责任从个人转移至车厂或运营服务公司,司机的角色将转变为乘客,无需承担事故责任,但仍需对自身安全负责。

从政策推动角度,2023年11月以来政府已着手推动L3级别的自动驾驶落地,多部委联合开展L3车辆试点工作。试点范围涵盖国内几个城市的特定路段,允许L3级别的车辆上路测试。

《火花谈》:作为粤港澳大湾区首个自动驾驶智能研究中心,研究中心的主要任务是什么?有哪些前沿探索工作?

郝景山:深圳自动驾驶智能研究中心承担了两个关键任务。首先,积极引进香港科技大学等顶尖科研力量,深度挖掘自动驾驶潜力。我们中心与香港科技大学机器人学院紧密合作,其中包括大疆车载CEO沈劭劼教授等多位专家学者,共同从科研角度探索自动驾驶的技术创新。

此外,我们还致力于构建企业孵化和早期投资的完整生态链,为自动驾驶领域的创新创业提供支持。通过这一布局,期望能引领自动驾驶技术的前沿发展,为粤港澳大湾区的科技产业注入新活力。

02

自动驾驶需要确定性,行业在探索新的大模型方法

《火花谈》:从技术层面,通用人工智能技术给自动驾驶发展带来了哪些影响?行业结合大模型创新的的趋势和路径?

郝景山:这个话题在2023年4、5月份非常火热,在业界引发多轮讨论。我个人观点认为,有两方面可以做基本判断。

第一个应用,大模型在智能座舱的人际交互中扮演关键角色。我所支持的企业已与多家主机厂展开合作,共同探索智能座舱内的语音交互技术,包括语音识别、理解及问题回应。目前,已有国内主机厂尝试应用大模型了,也做了一些发布,主要是将大语言模型作为一个知识库与助理的角色与司机进行交互,为其解答各类问题。

第二个应用,是类似于行程管理和规划。比如自驾游时,行程管理尤为关键。以往,人们通过携程等平台预订门票、酒店和餐饮。但是若缺乏当地向导,游客可能面临行程安排不合理顺畅等问题。大模型可以很好的解决这个问题,因为它对景区和餐饮资源有深刻的理解,车主只需要向大模型提出命题。

比如:“本周六早上计划前往张家口滑雪,请为我规划一个两天的行程,同行有两位成人和一个小孩。”大模型能迅速生成符合需求的行程规划。对车企来讲,他们更倾向于掌握预定环节,逆向引导消费者到订票平台,这些操作都将在智能座舱内完成。

现在谈论的大模型是一个庞大的语言模型。它的信息源自人类历史上的文本数据。本质上,大语言模型的功能是对人类既有知识进行压缩。当你向它提问时,它会预测并生成文本的下一个词汇,类似于信息的压缩与再预测过程。精准度有限,这也是大模型有时会产生幻觉,即一本正经地胡说八道。因为它可能并不真正理解某个命题,但生成的回答看起来却非常完整。

但自动驾驶领域,要的是确定性。自动驾驶领域通常分为几个核心环节:首先是感知,即对环境信息的捕捉与解读,包括检测车辆、道路和行人;其次是规划,始于高精度的自我定位,随后预测车辆在每一时刻的理想位置,并处理与其他车辆的交互逻辑;最后是执行,将规划转化为实际的驾驶操作,如加速、转向或减速动作。每一个环节被视为独立的技术栈。人们对大语言模型抱有厚望,期待它的智能涌现现象能够催生出一个完全端到端的自动驾驶模型,直接收车辆传感器的原始数据,如摄像头、激光雷达和定位芯片的信息,然后一股脑扔给大模型,大模型再输出车辆应如何行驶的最终决策结果。

这件事情在2022年是做不到的。但2022年有一个非常有影响力的事件——由上海AI实验室联合多所大学共同完成的论文,提出了首个感知决策一体化的端到端自动驾驶大模型UniAD,标志着自动驾驶技术的重要突破。该论文荣获了CVPR2023*论文奖。尽管这一成果具有显著的事件性意义,但距离实际的上车应用仍有相当长的距离。

所以,现在大家在做的是探索一种新的大模型方法。这种大模型参数比较大,但参考的不是大语言模型的做法,而是聚焦两件事,一是世界模型(World Model),让模型能真正深入理解三维世界的本质;二是大视觉模型(Large Vision Model),将感知中的任务通过大型模型重新做一遍,如目标检测、分类识别、跟踪等,通过大模型一次性解决多项感知任务。

03

大模型上车运行,国内还有较长的路要走

《火花谈》:当前,行业大以大模型支持自动驾驶落地的进展?这方面国内车企面临哪些挑战?

郝景山:目前,前沿技术方面已有很多进步,但实际上,大模型上车运行是一个在途研究的领域。现在大家能看到的自动驾驶或高级辅助驾驶系统中还没有应用大模型,但特斯拉已在此方面取得显著进展。

特斯拉FSDV12版本采用了端到端的大模型技术。尽管2024年前该版本仍为Beta版,但特斯拉此前已向全美车主推送了更新。新版本中,人工编写的代码极少,主要依赖于大模型运行。

非常有意思的是,我们能看到但是没办法学习应用。首先,特斯拉有全球领先的强大超算中心,国内车企及自动驾驶公司尚无法匹敌其计算能力,这个大模型的训练难度很大。

其次,数据来源方面,特斯拉的软硬件有一定切割,硬件是4.0版本,每一代硬件铺出去的车辆都是以百万计的,提供了丰富的实车数据。国内新能源车卖的最多的也就百万台,且车型配置低端。特斯拉的车计算单元、传感器的配比较一致。

最后,车载算力方面,特斯拉自研芯片,算力自主可控,国内主要依赖英伟达和地平线供应商的芯片,一定程度上限制了算力能力和优化。国内车企在大模型上车应用方面,还有较长的路要走。

04

换道赛车,走中国特色的车路云一体化道路

《火花谈》:展望未来,自动驾驶应用在两个方面,一个是特定场景下,另外就是公共路面,您对自动驾驶未来发展图景的预测?

郝景山:我们通常所说的公开道路,主要指的是有铺装路面并由交警执法管理的区域,遵守统一的道路交通安全法。与此相对应的是封闭或半封闭场景,如厂区或园区生产场所,可根据自身规章制度约束人员行为。

我国交通法规在保障行人权益方面有明显倾向,如斑马线上行人的路权优先于车辆。未来,有中国特色的车路云一体化方案将逐渐实施,包括智能红绿灯和多功能道路监控等,进一步提升交通安全预警能力。

随着自动驾驶技术的不断发展,L2+级别车辆的占比逐渐增加。据统计,2023年销售的电动车中,近一半已装备ADAS功能,预计2024年该比例和数量将进一步攀升。L3级别车辆也将陆续上路,上海、深圳、北京已发放L3试点牌照,允许车厂试点测试。

L3级别的自动驾驶不仅涉及车端功能,路测也至关重要,以解决定责问题。在发生交通事故时,要明确责任归属,甚至需进行事故回放。北京亦庄已成立专门公司,要求车厂在开发L3车辆时植入其API收集运行日志等信息,确保事故定责的准确性。

北京理工大学设立了一个全国性数据中心,用于监控所有在中国销售的电动车。这些车辆都配备了tbox设备,能够实时传输GPS定位和车辆基本信息到数据中心。以往车辆行驶达到2万公里后,国家补贴才开始发放,现在信息量大大增加,对基础设施的要求也显著提高。当然,技术的实施需要结合规则管理、社会和国家政策等多方面因素。

在前工信部部长苗圩所著的《换道赛车:新能源汽车的中国道路》一书中,他作为亲历者解读了这场产业变革中的趋势与机遇,深入剖析了中国汽车电动化的发展历程与前景。

第一是汽车产业的发展的电动化,其次是智能化。电动化方面中国遥遥领先,2023年中国乘用车销售中电动车占比已达35%,销量高达900万台,超过整个欧洲的汽车销量。智能化将成为下一阶段的发展重点。

我们要走一条具有中国特色的技术路线——车路云一体化。这个构想已得到了清华大学汽车系李院士的积极倡导和推动。

我们在朝着一个高远的目标发展的过程中,总能有一些收获。场景应用确实是个难题,对于所有参与的企业而言,是一个很大的挑战。如果是探索,到底投多少比例的研发力量和成本去做这个事情?如何透过迷雾,看到后天的景象?从某种意义上来讲,这是大家的机会。

商办进化

泛产业研究 新零售资讯 人物访谈
商业地产创新业务官方号,以创新视角关注商业地产办公领域热点。