小冰CEO李笛：智能语音助手尚处于早期，最好的方式是不用唤醒词

时间：2021-08-11 11:15 | 责任编辑：山歌 | 来源: 会员发布 | 关键词：

“今天，AI 产品或者是智能语音助手，都还处在特别早期的阶段。”对于已经发展了十年的智能语音助手，小冰公司 CEO 李笛依然认为其远远还未成熟。

十年前，苹果公司的 Siri 作为智能手机的语音助手正式面世，由此掀起一场风潮，从智能手机、智能音箱，到智能手表、智能耳机，乃至于当下的汽车智能化浪潮，语音助手都成为标配，各家科技巨头也在谋划布局。

2013 年加入微软亚洲研究院的李笛也在随后推出了智能助理小冰，其也由此成为“小冰之父”。近日，在搜狐科技全新栏目《AI 十二谈》首期的直播现场，作为嘉宾之一，李笛表示，自己经常会用智能语音助手，而小冰就是想探索智能语音助手终极形态的产物。

但智能语音助手的终极形态会是什么样？李笛表示，很难去下一个定义。“是完成任务的，还是无所不能、无所不知的才是最好的助理？很难说，每个用户有不同的需求。”

这种定义上的不清晰在或许一定程度上也导致了智能语音助手的发展缓慢，“人工智障”的吐槽暴露出其发展中的问题。当下，几乎所有的智能语音助手都依赖于关键词实现唤醒，但偶尔会出现失灵情况。

不过，李笛表示，智能语音助手最好的方式是不需要唤醒词，应该像人一样，能够判断人是不是在跟它去交流，同时能够和人之间不停地边听边说边想，这就是所谓的全双工的方式。这在今天可以做到，只不过准确性可能不能用户所期望的那样好。

李笛的感觉是，用户对智能语音助手的期待其实比较高。他认为，Siri 更大的价值是尝试给智能语音助手一个相对比较拟人化的定位，这给用户营造了一个非常科幻的很高的期望值。“我们一直都还在为这个期望值而奋斗，努力去达到，但这条路还很长，非常长。”

李笛还分析了智能语音助手答非所问的原因，主要有三方面因素。一是智能语音助手的交互场景缺乏弹性空间，自身很难判断回答到底好不好，难以形成数据和训练上的交互回路。

其次，在跟智能语音助手交互的时候，获得各种各样的知识和事实的比例很小，更多时候是观点，而观点没有正确与错误，且有很多不同分支，这样给训练智能语音助手提出很多新的难题。此外，测试者的心态也挺重要，如果测试者不停问智能助手问题，那么语音助手通常表现也不会很好。

尽管智能语音助手还存在不少问题，但目前应用已比较广泛，未来可能会更加深入，语音交互也被视为新一代人机交互方式。这就伴随着新的问题，该如何看待智能语音助手的定位？

“如果你把它定位成助理，容忍度不会特别高，但把它定位成朋友，容忍度就会高一些。”李笛说，当我们认为交互的是一个系统时，会把它物化，那么就不会去关注它的其它方面，容忍度也会相应低很多，防备心也会高很多。当把它视为有情生物的时候，它就可以成为对等的交互对象。

他认为，对于智能语音助手来说，真正重要的是越长越好的交互，交互里面的 topic(主题)覆盖越丰富越好，人的状态越放松越好。“当更多人在跟智能语音助手交互的时候，它的 topic 分布和其他人的交互 topic 分布越来越接近的时候，表明语音助手越来越被当做一个人来看待。”

但不可否认的是，智能语音助手在给我们带来便捷的同时，也会存在伦理和隐私问题。李笛提到，全球范围内，AI 伦理还处于非常早期的阶段，数据到底应该怎么使用，应该由企业自己去监督还是怎么样，数据是不是可以从 A 企业到 B 企业或 B 研究机构，这些都还没有明确。

“某种意义上，只能靠我们自律。”他说。