景鲲:我觉得现在最重要的环节是用户体验。尤其是当我们的合作伙伴变多之后,是不是能保证每个设备都能有一个比较好的一致性的用户体验?这个对于我们来讲是比较关键的。因为这种时候,最好能达到这样的效果:就是能让用户在不同的场景里面,使用任意一款搭载DuerOS的设备以后,在那个场景里面都是喜欢这个DuerOS赋能的设备的,并且习惯一直用这个设备。所以我认为现在最重要的就是整个用户体验,你是不是真正买一个音箱回去能持续用?你说的话它能懂?打开包装,有一个从来没用过智能音箱的人说这是什么?你说这是一个智能音箱,一句话就能清楚,一句话就能跟这个设备交互,我觉得这种体验是现在生态系统的核心,我们生态系统必须要靠比较好的体验才能往前推。
提问:刚刚他们都说到我们之后要推一个没有唤醒词的设备,我很好奇,我们在开发者大会的时候收购了一个做唤醒词的小的团队,我想知道他们在这4个月当中是承担着一个什么样的角色?为什么我们收购了这样一个做唤醒词的小的团队,现在我们又推出无唤醒词这样一项技术?
景鲲:它只是在手机百度App这个环境里面,朗读模式免唤醒词。不是在家庭环境中的那种智能设备的唤醒词,那是做不到的,而且也存在一些隐私问题。所以只是限定场景,限定在App里面的人机交互。在家居的智能交互里面,唤醒词是必不可少的,因为有一定隐私的保护性,先唤醒它之后再跟它说话,没唤醒之前,他不跟人做任何的交互。我们收购的公司叫KITT.AI,是做智能家居领域智能交互的唤醒词的。我们很多合作伙伴都想做自己的唤醒词,包括DuerOS赋能的音箱、冰箱、电视,他们都需要在设备上为唤醒做优化。他们往往需要针对设备优化。因为麦克风的距离不一样,麦克风的个数不一样,所以需要对于这些设备进行特别的调优才能真正保证好的用户体验。通过KITT.AI,我们已经把这种技术推给我们的合作伙伴,搭载在他们的麦克风里面,使得效果更好。
提问:我们这次推出的智能硬件是搭载DuerOS系统的,和之前搭载这个系统推出的其他产品有什么能力上的差别?
景鲲:它是首先搭载DuerOS 2.0的。DuerOS 2.0实现了各方面的能力升级,其他的设备基本上都会被升级到DuerOS 2.0上。渡鸦相当于DuerOS 2.0的第一个标杆,我们后续会把DuerOS 2.0开放给我们的合作伙伴。
提问:我来自机器之心。DuerOS这个名字里面,我觉得OS应该是重点,现在各个语音厂商也都是有自己的平台,模式其实看来是大同小异的。我想知道一下,DuerOS在一些商业模式、内容模式和本身技术的模式方面和其他家的差异化在哪里?对于OS这两个字母,我感觉定义的是有一点模糊。如果搭载在一个智能音箱里面,我们跟它对话交互,它就算是一个OS。其他家的这种系统也是搭载在音箱里面能交互,为什么Duer就能叫OS?
景鲲:首先你提到商业技术能力,商业化目前不是我们的目标。我觉得在关键时候,先把用户体验做对了,这是最重要的。如果用户体验没做对,商业都白扯,可能还到不了那一步,所以用户体验最重要。对话式AI大家都在做,大家都看好这个方向。7月5日我也在说,科技版图上四家最大的公司都在做对话式AI。每家公司在做的时候,基本上都会沿用之前这个公司比较擅长的。它就自然变成了这个产品最大的特色,基本上可以这样看。每家的DNA不一样,每家做了这个平台之后,感觉也是完全不一样的。DuerOS是把百度最强的能力发挥出来的一个平台,所以百度跟其他平台有什么不一样、DuerOS就有什么不一样。比如有的友商语音识别做得很多,只是语音转文字的。百度以前最大的市场是百度搜索的生态系统,百度对语言的理解是百度最大的不一样。所以百度最大的不一样放到DuerOS上,这就是DuerOS最大的不一样。相当于DuerOS对语言的交互,对语言理解之后,还可以把更多的内容和资源,以及开发者,原来我们的开发者是网站开发者,后来是App开发者,把这些都聚到一起。所以DuerOS就变成了一个窗口,去访问原来百度后面生态平台的很多资源。所以DuerOS就是百度AI能力和资源集大成者的一个缩影,是对话式人工智能的一个缩影,所以它最大不一样就是百度的势能跟其他的公司不一样。如果你这样去评估别人的平台,也能得到一样的结果,就是每个平台背后都有他整个公司的缩影,这就是这个平台最大的不一样。
对于OS明确的定义,其实最开始是我提出来叫OS的。我对OS更多的看法是它是一个生态,一个操作系统。操作系统背后是一个生态,是一个平台,不仅仅就是音箱的一款产品。这取决于业务的发展思路,是做一款东西,还是想做成一个生态,把大家在这个平台上一起推动发展。我觉得DuerOS代表了我们的愿景,OS就应该是一个生态。我稍微引申一下,一个OS最核心的关键点,不是它叫不叫OS,是它是不是有自己的生态。如果他没有自己的生态,它就不是OS。移动时代有很多OS,有很多OS叫OS,但是后来你发现,它都没有自己的生态。有自己的生态的全都可以称为OS,Android有自己的生态,可以称为OS,Windows有自己的生态是OS,如果你是附着在这些平台上的就不能叫OS,因为你没有自己的平台。所以我们DuerOS也是希望在语音交互这种新的模式下,我们能够创建自己的生态。这个生态是基于新交互的生态,这是我们为什么命名成OS的原因,就是它是一个开放赋能的平台生态。
提问:今天最开始在宣传片里面,大家说现在这个技术是基于Android或者是Linux的,是我看错了吗?
景鲲:你可以这样想,原来那些系统都是上一代的,是一个底层的系统,并不是那么关心交互的。DuerOS其实是以用户交互为驱动的一个操作系统。移动时代跟原来的PC有很多不一样,AI技术跟原来的不一样,AI的设备也很多样。这种多样的情况下,DuerOS要做的就是通过语音交互,把用户统一在一起。虽然设备很不一样,但是都用一个交互统一在一起。这是DuerOS要绑定的关系。其他的OS我把它看成是我们原来的系统适配层,适配到原来传统的OS。但是DuerOS是一个语音交互的平台,更上层一些。
提问:刚刚说到开发者,类似于DuerOS上面有100个Skills这种概念,这些Skills是开发者贡献来的还是你们自己?
景鲲:我们有自己100个原生的。现在有很多开发者,作为我们前期的尝鲜者,他们在我们的平台上搭建了100多个第三方的Skills。
提问:原生的是100个,还有100个开发者的?
景鲲:对,第三方的。