11
Alexa,人工智能,机器学习

Alexa是云端的智能助手,通过互联网运行。Echo音箱配有多个麦克风,因此具备远场语音识别功能。从2012年立项开始,我们的长期愿景就是让Alexa成为《星际迷航》中的电脑。你可以提出任何请求,比如要求它为你做事情或是找东西,与它的沟通非常自然和流畅。

从技术层面来看,Alexa和Echo的研发工作非常具有挑战性。工作人员达到数千人,团队分布于包括马萨诸塞的剑桥、柏林和西雅图等多地。

对于Echo,我们有几个不同的问题需要解决。最开始播下Echo的种子时,我们的一个关键设计理念就是Echo是一台永远处于开机状态的设备,可插入墙壁电源插座中,因此无须充电。Echo可以摆放在你的卧室、厨房或客厅里,为你播放音乐、回答问题,甚至最终进化为一种灯光及温度等部分居家系统的控制器,你只需说一句“Alexa,请把温度调低两度”或是“Alexa,把灯全关了”。这就是这种环境下非常自然的互动方式。在Echo和Alexa之前,人们与家庭自动化系统交流的主要方式存在很大问题:靠的只有手机上的一个应用程序。想要控制灯光时,你还得找到手机、拿起手机,打开一个特定的应用程序,再找出相应界面,通过应用控制灯光,这种费时费力的操作是不言自明的。

广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元

我们的设备团队刚刚完成了一项了不起的工作,而未来的路还有很长。我们对Echo和Alexa制订了一份精彩的规划图。我们现在拥有一个由其他公司组成的大规模第三方生态系统,为Alexa打造我们所称的“内置功能”,因此,这等于对Alexa的能力进行了拓展。

我们距离创造出像《星际迷航》中的电脑那样魔幻而神奇的东西,还有很长一段时间。这是我们长久以来的梦想,类似于科幻小说中的情节。当今,我们已经在用机器学习解决令人惊叹的问题,也确实到达了一个发展进程不断加速的临界点。我认为,我们正在进入一个机器学习和人工智能的黄金时代。但是,距离让机器像人类一样做事,还有很长的路要走。

即便是对于尖端的人工智能研究人员而言,类似人类的智能仍然充满了奥秘。想想人类的学习方法,你就会发现我们在数据处理方面的效率非常惊人。因此,当我们训练Alexa这样的人工智能去识别自然语言时,我们会用到数百万个数据点。另外,所谓“基准数据库”的搜集也是必要的。搜集这个最终成为Alexa学习训练数据集的基准数据库,不仅要付出巨大的努力,也要注入庞大的资本。

当今,如果你正在为一辆无人驾驶汽车设计和构建一套机器学习系统,那就需要数百万公里的数据才能教会这辆汽车如何驾驶。而人类的学习效率却高得惊人。无须数百万公里的驾驶经验,人类就能学会开车。用专业术语来说,我们所做的事情,或许就是机器学习领域中的“迁移学习”。

人类已经学习了诸多不同的技能,并能通过非常高效的方式将其映射到新技能上。最近刚刚打败世界围棋冠军的阿尔法围棋机器人程序,已经积攒了数百万局围棋的经验。人类围棋冠军只下了数千盘围棋,远未达到数百万盘。即便如此,人类围棋冠军和计算机程序却几乎处于同一水平。除此之外,人类所用的方法与计算机有着本质上的不同——之所以确定这一点,是因为我们在节能方面非常高效。

我不太记得确切的数字,但阿尔法围棋机器人是一个耗电量为百万瓦的例子,估计等于超过1000台服务器同时运行。而人类围棋冠军李世石的耗能却只有大约50瓦(1)。不知何故,我们竟能以超乎想象的高效率进行这些难以置信的复杂运算——不仅能高效地进行数据处理,还能高效节能。因此,在机器学习领域,我们还有很多东西要了解。

机器学习之所以是一个激动人心的领域,原因也就在此。我们正在解决极其错综复杂的问题,不仅涉及自然语言和机器视觉之间的一个领域,有时甚至会触及二者融合的部分。

在收到关于设备或服务的隐私侵权索赔后,隐私保护机构便会试着对声明中的情节进行重演。对于这些机构而言,这种做法其实非常容易,而机构也已驾轻就熟。机构会对设备进行逆向排查,以判断相关隐私索赔是否属实。这种做法很值得赞誉,我也很感激所有采取这种做法的隐私机构。这些机构揭露了公司所犯的无心之过,因为有的时候,公司的确不够细致、谨慎。

如果听不到唤醒词“Alexa”,我们的设备便不会将任何信息传输至云端。一听到唤醒词“Alexa”,设备顶部的光圈便会亮起。这时,设备就会将你所说的内容发送到云端。如果想让Alexa完成查看天气等一整套任务,我们就需要访问到云端的所有数据,因此这一步骤是不可或缺的。

黑客入侵是我们所处时代的一个重大问题,我们必须在全球范围内找出问题的解决方法,而其中一些解决方法将会成为法律。一部分黑客入侵是因为某些机构违背民众意愿,该如何管控这些行为,现在尚不明晰。

有了我们今天的绝大多数设备与技术,通过将激光束打在你家窗户的玻璃上,或是在你的手机上安装可开启所有麦克风的恶意软件,别有居心者便可轻松地对任何对话进行监听。当今常用的高端手机上配备有四个麦克风。因此我们必须明白,社会管控美国联邦调查局这样的特定机构或许更加容易,因为我们可以团结在一起来制定规则和法律,以及影响法院该如何执行。但是在我看来,隐形的网络黑客入侵等问题是尚且无解的。我还不知道我们该如何应对。

一个由互联网连接的社会是否能够实现真正的安全,对此我还没有答案。我们已经与这些技术共同生活了如此长的时间。人们走到哪里,都想随身带上手机,我认为,这种“手机现象”的存续已是大势所趋。我们的手机完全由软件控制。手机上配备多个麦克风,这些麦克风也由软件控制。而手机中的收音机,则可将数据传送到世界的任何一个角落。

因此,将任何一部手机偷换成监听设备的技术能力业已具备。对于Alexa,我们的团队做出了一个非常有趣且在我看来意义重大的决策。这个决策就是在Echo上配备一个关闭麦克风的静音键,我希望其他公司也能加以效仿。按下静音键,设备和光圈都会变成红色,而这种红光是通过模拟电路与麦克风连接的。也就是说,当红光亮起的时候,麦克风就不可能打开。对于这一点,黑客通过远程入侵是无法操控的,但手机就不同了。


(1) 阿尔法围棋机器人的耗电量约为人类的5万倍。