理想L9上差点留下的“小遗憾”,做起来有多难?

理想ONE创造了智能空间1.0时代,多屏交互和全车语音对话,让后来的整车厂在介绍自己的智能驾舱特点时,只用“理想ONE能实现的那种,我们也能实现”一句话来向用户解释所有功能。


成为智能空间的一个参考答案,是理想汽车0-1阶段所有人白手起家的战绩。


勾晓菲(智能空间负责人)说,“哪怕没有任何人尝试过的事情,我们也愿意去挑战。我们公司可能在初创过程中就埋下了这样的意识:如果我做得和成熟企业一样平庸,咱就得死。如果做不出来,咱也得死。只有做得和他们不一样,比他们好,咱才能活。”


在智能空间上的领先,意味着,已经完成拓荒的理想汽车,距离智能空间2.0时代的黎明更近了一步。


建筑大师埃利尔·沙里宁(Eliel Saarinen)曾说,“在设计一件东西的时候,一定要考虑到比这件东西更大的环境——椅子在房间里,房间在住宅里,住宅在土地上,土地在城市建设规划中。”


我们把视野放在理想L9打造的20平米的视听空间内,有3块15.7英寸的OLED屏幕,可以看3K分辨率的高清电影,21个扬声器,7.3.4全景声音响布局,让家人能听到宇宙飞船由远及近的声音,看枪战电影时还能感受二排4D座椅的震动,太完美了。


但最大的破绽是,后排的家人应该怎么和屏幕交互?


可以起身用手触摸屏幕,也可以指挥理想同学,但一帆(智能SPDT负责人)说,“当你心里没有一部电影的时候,用语音找起来的方式是非常费劲的”,这意味着,没有一个足够好的遥控器,来满足用户随时出现的“小需求”。


这个“小遗憾”很致命吗?

反正创造理想L9的人,是忍不了。


01

蝴蝶扇动翅膀

理想同学“睁”开了眼睛


理想L9车内拥有3D ToF传感器和6颗分布式麦克风,配合理想汽车创新的以深度学习为基础的多模态三维空间交互技术,让小朋友和长辈都能在车里以自然的方式进行交互。


理想L9掀起的这场“三维空间交互”的变革风暴, 往前追溯,始于蝴蝶扇动的翅膀。


“在四音区的车里,有一个场景是,当二三排都坐人的情况下,二排的妈妈想要让理想同学听清楚自己的需求,可能需要和坐在三排正在打闹的小朋友们说先不要捣乱,但小朋友不一定每次都听话,所以使用语音就会比较费力一些”。


胡含(智能空间PDT负责人)说,“2021年,当时大家一直在问,为什么要做六音区?第三排好像没有什么需要控制的,六音区看上去是一个白投入的东西。但从四音区改成六音区,李想没看材料就同意了。因为他认为空间交互是未来的核心方向,我们希望全家每个人都有属于自己的空间,都有属于自己的空间交互。如果两个人在同一个音区里,谁的使用体验都不会好,他们会互相串话。”


理想L9配备了6颗分布式麦克风,理想同学能分得清六个座位的不同指令,加上增强算法MIMO-NET的应用,相较于传统的信号处理算法,音区定位的准确率可以提升20%。在多人讲话的场景下,主音区的识别错误率可以下降30%以上。


我们不仅让理想同学的“耳朵”变多了,听得更清楚了,我们还想让理想同学拥有“看见”的能力,3D ToF传感器的加入,让理想同学睁开了“眼睛”


3D ToF传感器和传统摄像头的区别是,它能看得见深度信息,“普通摄像头成像是一张平面图,是照片,照片看不出远近,只能推测,没有办法精准识别它到底离你有多远,但3D ToF传感器就能看到,你从哪个地方过来了,看到位移的信息”。


我们可以在一个三维的世界里,进行交互了。“座舱内感知的需求其实一直有,只是反过来说,如果没有这块二排屏,后舱感知的意义也不大”,一帆说。


利用3D ToF的视觉感知,我们可以做手势交互。每个人的手就是造物主最完美的作品,也是车内最好的遥控器(之一)。


但怎么用好这颗传感器呢?我们要选择什么样的方式做手势交互?

珊珊(产品-软件-智能实验室)说,“最早我们想的是手势交互要不要做上翻下翻左翻右翻,不同手势代表不同的执行命令,比如比个OK的手势代表播放”,只不过这样的操作,从本质上还是指令式的一维的交互。区别只是,以前需要输入复杂的命令行,现在是记住一个固定的动作。


一个指令对应一个结果,听起来很简单。但功能越来越多,需要记的指令就会越变越多,用户的学习成本和记忆成本只增不减。


没有一个好的交互作品,是奔着复杂的原则去设计的。但为什么有时候我们会走进迷宫?答案其实是,我们对于简单的标准不够清晰。人最本能的动作就是最简单、最高效的交互方式,就像乔布斯用手指与屏幕的交互方式。


对于三维空间交互来说,简单的标准是什么?子扬(产品-软件-理想UI负责人)说,“简单就是自然,符合用户对这件事情的认知,再加上及时反馈,所有的操作都会有立即的反馈”。


珊珊说,“后来我们想到了可以把人的手当成一个鼠标来用,用户自己能看到屏幕里的光标在移动,不需要去记手势,握拳就相当于鼠标点击,拳头移动就是拖动,握住,点击,拖动,就这三件事,能满足不同的交互需求。”


这个交互原理,在某个VR设备上也被应用过,但在车辆上应用是独一份。


在车上为什么难做?因为VR眼镜的使用环境一般是在室内,环境开阔,光线好,座舱内整个环境更复杂,车内遮挡物也多,车是移动的,光线变化复杂。而且消费级的摄像头无法上车,因为在车内的摄像头有对温度的要求、碰撞的要求,必须是车规级的硬件才能使用,但这意味着,对3D ToF传感器的要求会高很多。


更麻烦的是,3D ToF传感器应该布置在哪个位置?“当然最好是能平视二三排用户的角度,但这在车里无法实现。我们希望屏幕展开时,后排用户观影角度舒适,前排用户转头时安全,后排的天窗要足够大,用户的视野足够好,所有这些需求都要同时满足,但在车内空间有限,每个毫米的移动,都可能带来其他模块的问题。”


传感器的位置不能大刀阔斧地改,产品团队的泪水只能往心里流。珊珊说,“有时候感觉手怎么都检测不到,把图拉出来一看,摄像头看到的图像角度太大了,倾斜角或者是边缘问题,都需要靠算法来优化,不断的调整模型,去解这些不常见的问题。”


“有次我们测试车内K歌,拿着麦克风唱歌,突然车窗打开了。分析发现是触发了语音多模交互功能,测试同事手拿麦克风的动作,食指是向左指的,被误识别成了打开窗户的手势。这个时候,我们深度信息的优势也展现出来了,我们在算法里加入了深度的信息,把手势和麦克风剥离开,因为它俩不在一个深度上,就能实现。”


子扬说,产品-软件团队最焦头烂额的时候,是看到第一版的软件效果时。“从整个需求输出到最后的实现,只有几个月的时间。但第一版出来后,光标漂移、点击都不准,你想点一个图标的时候,光标已经飘到另一个图标上。更别说播放控制比如调节音量,调节进度的交互需求了。”


后来,团队的小伙伴想出了一个方案,在视频的播放界面,可以通过拖拽的方式调节音量和进度,和自由光标来控制进度不一样,只需要做对应方向上的简单抓握和移动。“这就是我们的播放控制方案,我们和研发去做评审,研发以最快的速度做出了效果,给我们吃下了一颗定心丸”。


逐渐靠谱的隔空触控成型了。通过握拳、移动和挥手等,就能隔空打开二排屏、点选卡片、完成拖拽投屏等原先需要触摸屏幕才能完成的动作。


在理想L9这个“家”里,所有的“小需求”可以被我们自己轻松搞定,既不需要遥控器、也不需要麻烦其他人。因为理想L9创新的三维空间交互技术是一套完整技术方案,它融合触控、语音和体感交互方式,让我们在这个空间里随时随地,以简单自然的交互方式去解决各种“小需求”。


02

“叔叔,你还有别的魔术吗?”


产品专家李一博前两天在店里碰到一个和爸爸来看L9实车的小朋友,经过简单的示范后,小朋友自己握着拳头能隔空拉动屏幕里的卡片,说完“打开这个”,理想同学就能打开他旁边的车窗,小朋友非常开心地问他,“叔叔,你还有别的魔术吗?”


在小朋友眼里,不分语音或者视觉,在他们看来,这是自己可以变出来的魔术,是理想同学赋予自己的超能力。


有人说,理想同学是他家宝宝的第一个同学。2021年我们和理想ONE的用户进行了一次共创会,主题是“孩子喜爱的理想同学是什么样子的”。用户说了一句让所有人动容的话:“我们小时候都希望有一个懂你的人,帮助你的人在身边跟你一起成长,那么我相信我们的孩子也是这样想的,我的童年没有哆啦A梦,但希望我的孩子有理想同学。”


理想同学成长的背后,是一群心思细腻,关注家庭用户中每个人需求的工程师们。


在理想ONE上加入的“我也要”,是因为语音的产品经理盘到了车控车设的部分,突然想到了自己真实的家庭生活:在平常自己开车的时候,如果用语音调节了车窗或者空调之后,坐在后排的小朋友总会喊一句“爸爸我也要”。由此灵感迸发,做出了“我也要”这个功能。


在理想L9上,“睁开眼睛”的理想同学,已经可以听得懂“这个”和“那个”分别代表什么。生活中,我们总喜欢说“这个”和“那个”,但当别人说“这个”和“那个”时,我们永远搞不清这个和那个分别代表哪个和哪个。


想要打开天窗,父母也不用提前问,“想打开这个应该怎么说”,既不用斟酌是“打开天窗”,还是“打开遮阳帘”,只用拿手一指,就能打开头顶的遮阳帘,左右的车窗等。


这就是理想同学和3D ToF传感器共同实现的“融合指代”。


皓然(产品-软件-智能语音负责人)说,“最早我们在讨论这个功能的时候,觉得有点鸡肋,因为像打开车窗、打开天窗这类需求,有非常多的途径可以实现。可以按键,可以语音,觉得用手势也没有什么突破性。但真的用了之后,就会感觉我们真的面向了未来。它就应该这么做。因为它足够简单直接,让一个没见过的人玩,都能立刻懂。不用在脑子里过一遍,需要控制的这个东西叫什么名字,我要怎么说,不用思考就能实现。”


它仿佛天生如此。这就是最有意思的魔法。


03

“一起唱”和看球赛

快乐就像夏天的汽水能冒泡


一家人在理想L9里,可以看电影、看球赛、四个人一起K歌、四个人一起玩Switch。下一个问题来了,一家人怎么在三块屏上从真正意义来说K同一首歌?


老高(产品-软件-应用生态负责人)说,我们不使用市面上传统的投屏方案,有2个原因:


第一,传统投屏无法实现绝对的三屏同步。市面上的投屏方案,是从A终端录屏,再把内容投到B终端上,没有办法达到绝对的同步,会相差至少几帧的画面。


第二,在传统投屏方案中,没有办法进行交互。K歌这个场景再往下挖,三个屏幕实现绝对同步只是基础需求,每个屏幕前的“麦霸”都想拥有在自己屏幕前点歌的权力,传统投屏方案无法实现。


我们跳出K歌这个困境,升维进行思考,欢哥(智能空间-文娱组负责人)说,“投屏这个方案只能满足用户的基本需求,说白了就是几个屏一起播放,但我们要的一定是前后协同联动、可交互的产品体验,每一块屏上都是一个独立的播放器,如果播相同的内容,它就相当于一个投屏的方案,如果播不同的内容,因为播放器是独立的,也可以在不同的界面做对应的交互需求,我觉得这是空间能力需要的东西。”


我们以全民K歌为试点,希望可以三块屏,同时播放一个MV,并且在三块屏上还能各自交互。


“当时我们跟他们说要做这样的东西,他们觉得很意外,因为没有人这么做到过,他们也不觉得这个很容易能做到。”


但全民K歌的参与意愿比较高,他们把基础数据和内容开放给我们使用,“我们在一个多月的时间里做出了效果,他们觉得非常不错,然后他们就开始利用我们的开放能力去研究这个事情。”欢哥说,我们通过自研的方式,实现了车内空间独特的播放能力。


“第一个比较难的是数据的同源问题,要做好数据的预加载、缓存和共享。举个例子,比如大家点歌的时候不会只点一首,一般都点一排,在点的过程中我们就会进行资源的下载,但是用户不会按照顺序来唱歌,我们要做的就是怎么做好并发策略的设计,保证用户在诸如切歌的时候可以无缝切换,体验更好,也不影响整个系统的性能。第二个比较难的是,帧同步技术,比如当我们在车内看杜比电影的时候,前排的人把进度往后拉了5分钟,那我们需要后排屏的播放器马上一起切过去,保证前后排看到听到的都是一模一样的。”


欢哥补充,“对于我们来说,播放器的土壤已经有了,肥料也有了,往下就是怎么种庄稼的事情。如果不自研做这样的播放器,那举个例子,比如你想让某个视频应用同步播放,如果别人告诉你不行,你就无计可施。”


老高说,“在L9上,可以通过理想同学或者点击车机屏幕中的‘一起唱’就能同时拉齐三块屏幕的进度,1辆车,3块屏,4个麦克风,一家人K歌时再也不用互相递麦了。而且K歌的用户随时可以退出当前MV画面去点歌,点完歌再切回到MV。


为什么全民K歌愿意在最初把底牌能力交给我们进行实验呢?老高说,“我觉得他们的动力是理想汽车提出来的需求是基于用户的真实场景,从理想汽车他们可以打造出标杆级的驾舱K歌体验。”


标杆级的车机App,也有先例可循。在我们之前的采访记录里,“B站的CEO和CMO买了理想ONE,买完以后觉得这个车太舒服了,使用体验特别好,一定要想办法让B站‘上车’。因此,理想ONE的车机上有单独为车机而开发的B站。我们是率先做到中控屏幕弹幕‘上车’的企业,因为弹幕的效率很影响CPU的性能,B站派出了一个开发团队配合我们做联合开发。B站在理想ONE上‘上车’了之后,全国所有车企都去找B站了。


好用的App体验,好用的车机系统,生长在一个拥有100项旗舰配置的大空间里,更容易让人捕捉到幸福感。


2022年3月,北京疫情严重的时候,产品团队都在理想汽车北京研发总部外面的小树林里办公。

“有人把试验车开出来,我们在小树林里呆一天,晚上有人再帮忙开回去,上午我会带一提可乐,放在L9的冰箱里,等到中午吃饭就拿出来大家一起喝。这是特别简单的一个产品点,也特别提升幸福感。”


在车内看体育直播,也戳到了老高的心坎里。“如果你吃饭时间看,但你在公共场合,一个进球,你想呼喊一下,或者拍一下桌子都不行对吧。但在L9这个自己的空间里,这些事都能做。如果你和你的同事都喜欢同一个队,还能一起看,气氛就更嗨了。”


“再来两罐冰可乐是吧?”


“对对。光想都很快乐。我们给媒体和用户展示功能的时候,他们会说,这个是我们需要的,这个也是我们需要的。这一点我特别自豪。


用户们是这样说的,L9的产品力,让四十几万都不显贵了。”


*爱奇艺三屏同播功能和体育直播应用的上线将在OTA后实现。


04

车也是“第九艺术”

我还可以做很多很多年


子扬曾经是老罗的“男人”,是锤子科技的前员工。“在我眼里,做出一个好产品,比其他东西都重要。”


在选择车企这条赛道时,他也面试过不同的公司,“皓宇(理想汽车 产品负责人)面试我的时候聊了非常多产品的东西,他说我们要做一个非常好的产品,但我和另一家企业聊的时候,他们首先跟我聊的是基于他们的商业逻辑,他们决定要造车。我觉得这两个逻辑是完全不一样的。”


子扬没有犹豫,一脚踏进了理想的大门。“大家会说游戏是第九艺术,在我眼里,车在电子科技产品领域,就相当于第九艺术,车从外部来看是一个大型的机械装置,可以移动,但里面有AI的深度参与,我们也正在走向自动驾驶的路上,智能手机、智能电视和智能音箱等科技产品里的几乎所有技术和产品定义,智能汽车都包含在内了,车里面有无限可能。”


2017年的子扬,“当时觉得车有什么好做的,肯定没有做手机有意思,不就是做一个地图、一个导航、一个音乐,中间一块小屏幕”。


但在理想汽车的经历,让他感叹,“车子真的复杂太多了,太庞大了,太难了。L9证明了,车里的智能空间完全不局限于屏幕,它是一个整体。这件事是非常吸引我的。”


20世纪70年代,开发者尝试把软件开发的流程分为7步走(当其中一个完成时,就进入下一个步骤),称之为“瀑布模型”。因为这7个步骤,没有迭代,就像瀑布从不会回头一样。


几十年过去了,当可持续升级、常用常新的OTA成为智能电动车的标配时,传统车仍然像不回头的瀑布一样。车如果称为第九艺术,也是因为它始终都在变化,每一天都可以变得更好。就像古希腊哲学家赫拉克利特说的:“人不能两次踏入同一条河流。”


子扬分享了两个车机界面变更的思考,“理想ONE上就支持三指下滑返回到桌面。我们在L9上做一个非常小的、普通人不易察觉的优化,现在的三指下滑返回桌面,屏幕的内容是‘跟手’的,你手指往下拉到哪儿,屏幕内容就跟着动到哪儿,松手了会落下去,如果你后悔了还能往回推回去。这和你现实中去滑一张纸的感觉是一模一样的。”


在三块屏幕上,也能实现动态的高斯模糊。“俗称就是毛玻璃效果,后面的内容不会对这块玻璃上本身显示的内容造成干扰,带来的好处就是非常的有层级感,比如在控制中心,也能实时看到后面的东西在哪里,可以建立起屏幕间各个元素的层级感。在理想ONE上,在中控屏下拉了控制中心,是直接把左边的区域盖住的。”


但功能越丰富,对性能的挑战就越大。好的车机系统应该是什么样的?彦彬(智能空间-性能与稳定部负责人)说,“应该是用户一点感觉都没有的。用户不需要去考虑其他。就像你买新款手机时的流畅度。


高通骁龙的2块8155芯片负责车内屏幕的运算,前8155管HUD、中控屏和副驾屏三块屏幕,后8155为后舱娱乐屏、3D ToF传感器服务。对于车机系统来说,性能是基本功。只有操作起来足够流畅,人才会对系统有信任,有喜爱。


“很多业务在自己单独调试的时候都没有问题,放到实车上一起并发,就乱成一锅粥”。在彦彬看来,车机性能是资源调度的优化。


“研发是有技术追求的,比如说给我们一个特别简单的车机,做完之后并不觉得自豪。因为你好像什么都没干,它就能有这个效果。我们希望产品和业务越多越好,在保证性能体验的前提下,提供给用户更丰富的功能体验,才能体现系统优化的价值。”


最让彦彬感觉到“丝滑”的工作体验是,无论团队内部,还是兄弟团队之间,始终保持着开放,包容,积极的氛围。“在交付过程中,遇到了很多技术难题,但团队顶着巨大的项目压力,不轻易放弃任何一次尝试的可能。驾舱的业务和产品形态迭代速度非常快,这给系统的整体性能带了很大的不确定性和挑战。但是在交付过程中,大家分工明确,密切配合,互相支撑,共同成长,这是我喜欢的团队氛围。”这个氛围里包含,他们在拿出方案讨论的时候,没有职级之分,有时候彦彬也会被直怼。


珊珊团队里来了一个大厂的小伙伴,“他说在之前的公司,每次见到CEO就是看着CEO坐着专供电梯上去了,CEO不在的时候,别人才能用那部电梯”。但在理想汽车,你能在食堂、便利店打关东煮的机器前、买咖啡排队的队伍中,遇到李想。


“有时候他跑到我们同事这儿说几句话,聊了之后思维又发散了,就拉着两三个同事一起坐在公共茶水间开始聊,聊久了,周围人就越来越多。这在其他的公司,应该是极少的”。


他好像能随时出现在你的周围,讨论着有关产品的一切。这家企业里,从CEO、员工,到车主,都无比热爱自己的产品。


珊珊连续一个月超过夜里12点仍在工作,她也会跟丈夫说,太累了。但丈夫说,“我觉得你好像还挺喜欢这份工作,干得挺开心的”。6月21日,L9发布会结束,珊珊回到家都凌晨一点多了,丈夫还在等她。“他说我看完觉得挺好的,心动了,都想换车了”。


05

枪响之后,我感觉

子弹“打”在了我身上


欢哥说,早期测试车辆的时候,一般都是在“半成品”上面测试,可能有的有屏,有的没有,音响也没完全调教好,有些车甚至连座椅都还没安装,“就跟临时车间一样”,他边测试,心里边打着鼓:L9真的可以卖到45-50万这个区间吗


有一次,他拿到了一台相对比较完整的试制车。“我和团队里的同学,一起在车上面试效果,我印象特别深的是我们在看《狙击手》这部电影,有一个镜头在雪地里,窸窸窣窣有点声音,狙击手在非常安静的环境里开了一枪,我感觉这颗子弹直接打在了我身上!我们把全景声、屏幕、多模态交互都好好地走了一遍,我真的觉得这就是时代滚滚向前的进程里,一个完全不一样的东西。”


加班到夜里11点多,他开着试制车回家,儿子还没睡,儿子一般都会等他到家聊聊天。他打电话让爱人把儿子带下来看车。


“我跟他讲我们的车有什么功能,我儿子6岁了,坐在第三排特别兴奋,看完以后,我儿子就说,爸爸,这个车,以后我要买!我觉得真好啊。


欢哥说,“我能够深刻地感觉到,在智能空间这件事上,我们只是开了一个头。别人在卖车,我们是给你一个家。真的很不一样。


李想曾说,“在巨头主导的汽车行业创业九死一生,但这绝对是我和团队这辈子做出的最好的选择。”


2018年他在和张辉(理想汽车战略负责人)的一次聊天中说到,“可能我跟很多人不一样,我并不认为起点一定决定了什么,长期来看一个企业的成长速度决定了一切。没有任何一个新的企业起点会高过传统汽车厂商,天壤之别,特斯拉也一样。但不代表我们的成长速度、迭代速度比他们慢,如果从成长的角度拉开时间周期去看,就没那么焦虑了,你会看到诺曼底登陆迟早会来到。”


诺曼底登陆到来了吗?我们交给L9的用户来评价。


智能空间2.0的质变,也是理想汽车产品团队和智能空间团队飞速蜕变的三年。在勾晓菲看来,把每一个细微到不能再细微的地方都做到了极致,才能形成智能空间的技术竞争力。有人说,全中国最好的做智能驾舱的人,都在理想汽车了。而吸引那些有理想的人,勾晓菲说,“需要一个能够感动到他的未来,并且这个未来是有迹可循,有路可走的”。


一个能感动别人的未来,并不遥远。


瑷伊(产品-软件-智能驾驶)在跑路试的时候,开着贴伪装车衣的L9在偏远地区,都有老爷爷能认得出来,“那不是理想L9吗”。


这是老爷爷能认出的L9,

是孩子眼中会魔法的L9,

是长大了想买的L9,

是可以独乐乐也能众乐乐的L9。

《理想L9背后的人》,是我们与理想L9产品、研发、制造团队的对话。理想L9产品力提升的背后,是组织与人的双向成长。只有一个成长型的团队,才能为成长中的用户创造超越需求的产品。我们打破规则,是因为我们的认知先行一步;我们持续创新,是因为当别人放弃的时候,我们仍然在坚持。我们记录,然后我们继续颠覆自己——原来,一个人可以改变自己,一群人可以改变世界。


受访团队:产品团队,智能空间团队

作者:品牌-黄静娴

举报
评论 0