刘毅林:智能汽车的最佳交互——全场景语音
2020年8月13日-15日,"2020中国汽车论坛"在上海隆重召开。该论坛是由中国汽车工业协会(CAAM)主办,世界汽车组织(OICA)、世界经济论坛(WEF)唯一支持的行业顶级论坛。本届论坛以"新变局 新挑战 新思路--引领中国汽车新征程"为主题,紧扣时代脉搏, 求索突破之道,紧密围绕"十四五"规划,把控宏观产业形势,解析全球汽车产业发展动态。其中,在8月14日下午举办的"全球汽车技术发展领袖峰会"分论坛上,小鹏汽车互联网中心的副总经理刘毅林发表了题为《智能汽车的最佳交互--全场景语音》的精彩演讲。以下内容为现场演讲实录:
刘毅林:各位领导、嘉宾我压力很大,刚刚赵老师说了最后一个要押轴,从整个上午到现在大家从战略市场、商业技术层面分享了很多高屋建瓴,这里谈到一个行业当中最重要的词就是产业和产品都在发生变革,变革是一个非常重要的关键词。在这个里面又有一个词被大家提到越来越多,就是产品和体验,我在小鹏汽车负责产品体验的,所以我会跟大家分享一些我们在产品体验方面的心得。
吴院长提到广汽是一个年轻的企业,小鹏是更年轻的企业,我们在过程当中难免会有一些观点会跟大家有些不一样,也希望大家多多帮助和指正。
刚才提到变革是一个共识,实际上我们谈到革命和交互的时候,我们会发现往往革命性的产品不是单纯技术变革,我们会发现体验上也会做一些变革,刚才其实有其他嘉宾提到我们从PC时代到智能手机时代,我们发生了一个操作方式的变革,从键盘、鼠标变到了我们的触摸屏,这是大家举得比较多的例子。其实在别的方面也有类似的例子,比如说颠覆了整个音乐产业的MPS,它的控制方式演变成电视机的操作方式,电视机的摇控器在变革当中会发现越来越接近笔记本电脑操作方式。
这里有一个有趣的点,在一个产品变革当中它使用的技术不是一陈不变的,而是技术会和别的产品和别的技术进行教会和延续。
汽车里也面临着很多体验的变革,可能面临最多的就是我们跟数字化、互联网之间的碰撞,我们会发现大家现在越来越离不开自己的手机,只要手机没电就会焦虑,面对焦虑时我们过程当中看到非常多不同的方式去处理它,今天我们都没有正确答案说哪个是对的,哪个是错的。我们看到有些使用屏幕越来越多,或者把所有东西放到一个屏幕上,或者干脆依赖一个移动设备。
我们回过来看,中间的冲撞到底是什么?互相之间不融合的地方到底是什么?我会认为是技术本身,汽车我们会期望更快自动驾驶,把自动驾驶技术拉出一个横轴,我们手机已经是面向L5的技术了,我们希望在车里就可以玩手机,我们体验上面的错位怎么去解决呢?这里我们会认为语音可能是解决它的一种方式,在触屏时代已经到了汽车还没有准备好的时代,也许语音是一个好的解决方式。
回头我们来看,语音是不是直接去用?从刚才苹果的一些例子中我们看到,它在一个新的产品应用上其实发生了新的变化。它在笔记本电脑上用的和我们摇控器上用的方式是不一样的。如果回到声音的本身我们去看,有类似的产品叫智能音箱,智能音箱也经过几代的发展,我们发现智能音箱不仅仅是音箱了,更多的是+这个屏幕。我们发现人和语音AI之间有几个问题没有解决。
第一个是和语音没有达成共识,像智能音箱有成千上万的能力,我相信没有一个人去了解这些能力是什么,我们只能用的是非常少的能力,这个里面是缺乏一个共识。今天我们作为汽车界的论坛我们最大的共识是聊汽车的话题,这是有共识的,我们如何创造人和汽车之间的共识是最重要的。
第二个是反馈,我们发现这个识别有一个非常核心的点,它们都加了一个灯,这个灯是什么呢?就是听或没听懂指令,但是在用户端不够了,所以加了一个屏幕,是听对还是听错?
最后一个还是回到海量交互方式,你会发现这个里面有很多这些技能我们是没有办法去学习的。这个其实是导致我们在一个设备演进过程当中会有很大的问题点。这也是为什么智能音箱除了听和说之外把看和摸变成最重要的交互方式之一。
在这个过程当中,我们做了一些尝试,也就是说我们去思考未来的汽车,把语音作为核心交互方式,我们有什么方式去解决它?麻烦播放一下视频。
(视频播放)
在这个过程当中,其实我们会发现相比智能音箱这样的设备,车载环境我们既有屏幕又有麦克风,还有比较安静的环境,特别是智能电动车的时代。实际上在这里我们可以很好去通过视觉和语音的融合解决人和机器共识的问题,在这里面我们可以通过界面的反馈,可以尽可能降低我们跟设备之间的交互效率问题,我们可以看到刚才对话当中,其实用户所获得的反馈是实时的,他可以在界面当中获得这样的内容,不需要去用语音讲。
举个最简单的例子,我们看一本书的速度远远会超过我们听一本书的速度,作为一个交互方式来说效率是最核心的,最后一个也就是我们希望去达成的,就是怎么样让用户学习非常简单,我们今天的语音,刚才提到成千上万的能力如何去进行学习?这也是我们希望解决的一个点之一。
如果只是讲交互的话,是不是说这是我们整个智能汽车变革唯一了呢?我相信这个肯定不是。另外我们在行业当中经常会谈到的一个话题叫智能驾驶舱,我往往在想这个问题的时候,我其实经常会把这两个问题分开来看,也就是驾驶舱是存在的,我们今天给它一个新的定义叫智能驾驶舱,智能在哪里?以及为什么叫智能?
我们在这个过程当中可以看到行业当中或者说其他行业伙伴,对于智能由很多定义,有增加更多屏幕、更多内容、更多科技感或者更实体化的虚拟形象,这些都是我们尝试回答的问题,但是这些问题可能有另外一种方式去理解它。
如果我们回到一个最核心的点,我们会发现汽车变革其实更多在内部的变革,而不是外部的变革,我们会发现汽车的造型它还是跟原先的造型非常的像。外部的变革实际上只是针对我们跟环境之间的沟通,也就是V2X的部分,内部变革除了刚才大家都提到的电动化整个车身之外,整个空间变革也是非常大的。
如果再抽象一点,从输入和输出角度去看,我们画十四个轴,你会知道车辆的外部声音、外部控制内容以及车内驾乘人员的状态、车内空气的状态,要去的目的地以及各种各样的设置,你都可以把它当做一个输入和输出方式去看,我们在这个空间,实际上在一个封闭空间当中怎么样融合整个内部和外部的内容,然后产生这些智能化,这是我们去思考智能驾驶舱的起点。
我们会做一些比较有趣的例子,这不是实际的功能,我去放一个视频去阐述什么样的东西叫输入,什么样的东西叫输出。
(视频播放)
这是一个特别不严肃的功能,今天是一个特别严肃的论坛,但其实我们只是在用一个特别不严肃的功能跟大家阐述,也就是说我们其实在这里其实是输入了一个音乐,其实对外输出是灯光,如果往更加实用角度去看汽车和环境铸锭会发生变革,车和车之间通过灯光沟通的话,那么这个设备可以产生更新颖的变革,车和车之间的协同也可以变的更加实时一些,这只是最简单的一个例子,我们输入和输出可以有很多的方面,输入可能是一个温度或者一个人的表情或者人的眼神,输出可能是一个氛围灯或者温度角度,这会让我们设备发生全新变化。
这里我们希望让整个空间能够去接受和传达信息。今天其实提到很多概念是说软件定义汽车,我看到很多嘉宾谈到,但是从另外一个方式解读,其实是让软件能力和硬件能力充分进行融合,就像我们人类肌肉和骨骼一样,通过场景的方式让软件为硬件固定的东西去赋予新的能力,让硬件通过软件的控制传达信息产生新的变化,如果是软硬结合才能产生更加有趣的场景和有意义的场景。
这是智能驾驶舱的部分,回到很多年前,我特别想把以前的话题拉出来,也就是说车为什么需要一个大屏?车为什么需要一个系统?为什么不能装一个ipad?这是很多年前大家会讨论的话题,但到今天为止大家越来越少用这样的方式质疑了,为什么呢?大家越来越多了解到车里操作系统不仅仅是一个,我们看到有预控制器的操作系统、自动驾驶操作系统、人机交互驾驶系统。
这些系统如果单一来看的话,它可以被替代的,但车作为整体性的设备,有很多系是冰山之下的,不可以被替代的。比如说自动驾驶和车身的控制,这几个设备之间实际上是有自己的信息和互通的,机器的决策和机器的控制以及环境感知、接受智能指令,都是这几个预制间的通信,这才是设备变革之间不可替代的点。
在这里到底究竟能发生什么样的变化呢?我们跟支付宝的一些合作有些畅想,大家可以看一下这样的视频。
(视频播放)
在刚才的视频当中,我们其实把自动驾驶路段的信息和自动驾驶的状态,包括人是否疲劳的状态和时间,都跟车辆控制以及互联网的服务做了一些结合,我们希望是说这些互联网的服务,不是说我们在屏幕当中去新安装一个APP而已,而是真正能够跟汽车这样一个充满传感器和生活可能的设备进行深度结合。
我们回到最后,无论是从车的OS本身还是设备本身也好,网络服务和车辆功能、驾驶员和乘员状态、机器视觉等可以做更深入融合,接下来整个城市变的更加智能、车辆更加智能时,可以通过更加自然方式跟设备进行沟通,然后让整个软件和硬件可以真正交融在一起,不仅仅是软件定义汽车,而是硬件成就软件,软件成就硬件。
其实回到iphone1代发布时,有三个点始终是触动我的,一个是它花了很长时间去讲这三个部分的内容,一个新的设备一定会有革命性的交互方式,它会有很强大的链接能力,就像大家一直期待的5G,以及很丰富的生态体验,这个生态体验会跟我们上一代看到的生态体验是不一样的,这些一定会在汽车产品和产业当中发生,也会逐步让我们今天的汽车从一个单一层面智能到综合领域的智能,再到最后向刚才赵博士提到的成为完整我们生活当中的伙伴。
小鹏作为一个特别年轻的公司,我们特别在意我们的产品,也在产品上面做了很多思考,我们也落地了很多的思考,最后打一个广告P7,大家可以了解一下这台车,可以试一试,无论从产品的角度还是行业的角度,也希望大家多多批评和指正我的PPT和产品。
(注:本文根据现场速记整理,未经演讲嘉宾审阅)