作者|姚新禄编辑|安欣
女儿生日那天,朋友送了士兰一个智能音箱。是市场上常见的主流品牌车型。就是一个小方盒子,价格不高。斯兰对新奇的东西没有太大兴趣,就随意的放在客厅里。然而,他6岁的女儿却爱上了这个小音箱,总是缠着它讲故事。
渐渐地,士兰对这款智能音箱产生了好感。这是哄婴儿的神器。她高兴极了,开始在淘宝上浏览相关产品,打算买一台配置更高、音质更好的机型。
直到几个月前的一天,斯兰无意中打开了智能音箱连接的手机应用程序,意外地发现里面记录的一段文字是她刚刚和丈夫的谈话记录。令她惊讶的是,这段对话是在她女儿听完这个故事之后发生的。理论上来说,音箱已经处于休眠状态,不应该采集声音,更不应该将内容传输到手机上并转换成文本。
它有没有偷听我们的家庭谈话?斯兰心中浮现疑惑。家里人对智能音箱也抱有戒心,买新的计划自然就被搁置了。对于现有的音箱,士兰选择关闭电源。她的女儿喜欢听故事。她边听边打开一段时间,听完后就拔掉插头。在过去的四五个月里,他们一直这样使用它。
正在监听的扬声器
第一起广为人知的涉及智能音箱的窃听事件发生在美国俄勒冈州。
2018年5月,丹妮尔的丈夫接到下属的电话:立即拔掉你的Echo设备,你被黑了! Danielle 住在俄勒冈州波特兰,家里有四台亚马逊智能音箱Echo 设备。当天早些时候,她丈夫的下属收到了一份音频文件。打开后,他听到了丹妮尔和她丈夫在家里的私人谈话。夫妻俩正在讨论使用哪个品牌的硬木地板。
丹妮尔感到震惊,拔掉了所有Echo 设备的电源,并迅速致电亚马逊客服寻求解释。与此同时,她向哥伦比亚广播公司透露了这一消息。
对于这起事件,亚马逊回应称,这是一次误操作,也就是说,在运行时,Echo设备将对话内容误认为是命令,认为用户想要将之前的语音内容发送给地址簿中的某人,然后这个命令就被执行了。
Echo是亚马逊推出的一款智能音箱,搭载其语音助手Alexa。截至2018年中期,Echo在美国的出货量约为3500万台;据CIRP预测,其市场份额已达70%,远超其他品牌。
主导产品出事,消息迅速传开并发酵。不久之后,Echo 又发生了第二起事件。一位德国用户向当地杂志《c’t》透露,当他要求亚马逊向他发送有关他个人活动的语音数据时,他收到了一个100MB的压缩文件供下载。下载内容是解释Alexa 语音命令的PDF 分类。记录,以及1,700 条陌生人之间谈话的录音。
《c‘t》收听了部分录音,发现根据对话内容,可以拼凑出的生活细节包括:在家和外出的时间、家里智能设备的其他品牌、家里人的性别、甚至用户洗澡的声音。
尽管亚马逊已经为上述两起事件道歉,但这并未能掩盖舆论中逐渐成型的一个猜测:作为一种新兴设备,窃听智能音箱可能不仅是一个隐患,而且是真实存在的。当它听到唤醒词时就可以开始工作。这是否意味着智能音箱可以随时随地监听我们的对话?士兰对此表示怀疑。
近几个月来,更多与智能设备相关的窃听事件被曝光。今年7月,外媒报道称,苹果承包商表示,为了提高Siri的产品能力,苹果将聘请外部承包商审查录音,其中包括Siri意外激活时录制的私人对话,例如医疗记录。信息、毒品交易和其他信息。
无独有偶,就在同月,有消息称Google Assistant 将向公司员工提供录制的声音文件,甚至Google 在全球的第三方承包商也可以定期收听这些对话。
人们对智能音箱和各种设备内置的语音助手的质疑正在蔓延。不仅是窃听,智能音箱偶尔出现的自启动现象也让部分用户感到恼火。去年以来,有用户表示,Echo在未唤醒的情况下会大声笑,令人毛骨悚然。
类似的现象也出现在一些国产智能音箱上。一位用户透露,放置在家里的智能音箱突然多次报告设备正在进行系统升级,第一个应用程序已更新。虽然内容很正常,但是家里并没有其他人。说话的人突然说话,每次都让我害怕。一跳。甚至有一次,当她邀请朋友到家里,彼此愉快地聊天时,智能音箱突然醒来,毫无预兆地给大家播放林俊杰的《杀手》。
带屏幕的音箱带来了成像方面的质疑。随着窃听事件的增多,一些用户怀疑自己的带屏音箱有回家观看的功能。既然可以远程直播家里发生的事情,那他们会不会同时在家里直播呢?记录这些图像并将其传输到其他地方?
人们对智能音箱这一新产品的质疑越来越多。它从“它在听我说话吗”延伸到:它在睡觉时收集声音吗?采集到声音后,这些对话会被存储和传输吗?这些声音真的会被听到吗?而且,它会被黑客攻击并成为一个bug吗?
谣言与真相
张思成说,过去一年,很多朋友在购买智能音箱前都向我询问过监控问题。他曾在多家公司的智能音箱部门工作过,被朋友视为行业专家。更有趣的是,经过询问,几乎所有人还是买了这款音箱。
据张思成和多位熟悉智能音箱的从业者介绍,智能音箱的识别工作分为本地和云端两种情况。智能音箱未唤醒时,本地工作。虽然它会记录外部声音,但它不会存储和语义识别这些声音。睡醒之前,相当于做了声波识别的工作。徐嘉明表示,(智能音箱)将录制的声音与唤醒词进行比较。当声波匹配时,它会自动打开。徐嘉明是智能音箱产品经理。
张思成否认了秘密监控的传闻。据他了解,目前市场上主流的国产智能音箱都没有进行主观、刻意的监控。
这是一件成本很高的事情,张思成认为。他做了这样的计算:假设一家公司总共销售了100万台音箱,拥有20万日常用户。如果公司想要激活这些扬声器进行24小时监控,即使每秒产生100k数据,乘以20万,累积的传输带宽、存储和计算成本也是惊人的。
更重要的是,以目前的技术处理能力,企业还无法将这些海量、碎片化的录音转化为具有商业价值的有效信息。在张思成看来,即使不考虑道德方面,只考虑商业利益,企业也没有动力收集主观信息。
据张思成回忆,去年工信部主导的一项智能音箱测试项目中,每台智能音箱在未唤醒状态下传输的数据量仅为KB级别。对于语音数据来说,这个数据量几乎可以忽略不计。
与窃听传闻较为吻合的是智能音箱在唤醒词后的工作模式。
张思成和徐嘉明都承认,音箱被唤醒后,会进入云端工作状态,将采集到的声音传输到云端服务器,完成语音语义识别和反馈。这是不可避免的,张思成有些无奈。他提到,目前智能音箱内置的计算能力无法支持AI式的语音语义计算,更谈不上提升本地的识别能力。
为了避免网络故障和隐私问题,张思成的公司在一些客户定制的全屋智能中提供了仅在本地运行的语音解决方案。然而,这将使功能变得非常简单,并且仅支持固定命令。例如,主人回到家后,可以告诉语音助手开灯,但如果他切换到开灯,语音助手就无法识别。
根据智能音箱的产品策略,当用户结束命令并且几秒内没有新的声音出现时,机器将返回睡眠状态。徐嘉明透露,每个品牌的设置都不一样,有的在3秒内,有的在5秒内。但在实际工作中,由于智能音箱整体成熟度有限,无论是唤醒还是睡眠都可能出现错误。例如,恰好有类似于唤醒词的声音,或者命令结束后有其他声音,使得智能音箱认为需要继续工作,所以会继续采集声音,而用户则不知道这一点。据他推测,包括斯兰在内的不少用户遭遇的所谓窃听事件,就是出于这样的原因。
据不少从业者介绍,目前智能音箱行业理想的误唤醒率是每48小时2次左右,最坏的情况是每24小时2-3次。这无疑意味着由于误操作而导致的误唤醒率更高。所谓窃听频率。对于每个品牌来说,当下最关键的就是提升AI能力,减少误操作。收集到的语料就是最好的训练材料。徐嘉铭提到。
今年4 月,彭博社调查报道称,亚马逊在全球有数千名员工负责人工监听和审核用户与Alexa 之间的对话,并对这些录音进行注释、检查和提供反馈,以减少误操作,帮助Alexa 变得更好。响应指示。罗马尼亚的两名亚马逊员工提到,他们每天要工作9 个小时,解析多达1000 条音频。
这其实在业内已经不是什么秘密了。张思成认为,不仅国外品牌,国内几个主流智能音箱品牌都有人工审核环节。为了尽可能保护用户隐私,录音在人工收听前会进行脱敏、分散处理。虽然员工会听到录音对话,甚至涉及私人事务,但他们将无法识别用户的具体身份。在云端过程中,音频文件本身不会对应用户账户信息和设备信息,主要是为了优化指令。国内某主流智能音箱厂商回应。
总语料中经过人工审核的不到1%,主要集中在难以识别的内容上。例如,当说话者回答“我不明白你在说什么”时,这句话之前的内容将优先进行人工审核。 ”,张思成解释道。在他之前工作的公司,当某些新功能推出时,为了提高准确性,某些语料的收听比例会提高到10%左右;不过这种工作的持续时间很短,往往经过几天的努力,就恢复到了正常的比例。徐嘉明也认为,随着AI模型识别能力的提升,采用人工审核的企业比例可能会减少。
智能音箱收集的语料不会永久存储。前述扬声器厂商表示,识别完成后,音频文件将被删除。每个公司保留文件的时间长度各不相同。就我们而言,大约是几个月。徐嘉铭补充道。
无处可逃
毫无疑问,智能音箱等语音助手产品还不是一个成熟的品类。
这使得此类产品容易受到许多漏洞的影响,例如误唤醒和黑客攻击。去年8月,在美国拉斯维加斯举行的全球黑客大会Defcon大会上,腾讯安全团队仅用26秒就成功破解了亚马逊的Echo,并远程控制了指定设备,使设备处于不唤醒、无提示的状态。静音状态下自动录音,并通过网络将录音文件发送到远程服务器。
当2300台智能音箱中的一台智能音箱受到物理攻击时,其他智能音箱就可以通过局域网内的非接触式攻击被黑客放入后门,成为黑客的远程窃听者。腾讯安全专家吴惠宇在此次打击行动后不久的一次演讲中表示。当然,在腾讯提交这些漏洞之后,亚马逊已经完成了这部分的修复和更新。
另一方面,由于智能音箱出现时间短、成熟度不高,目前尚未形成黑灰产业链。公司对记录的语料库实行非常严格的保密级别。张思成透露,在他工作的公司,所有涉及录音的工作都会在公司内部完成。虽然由于人员有限,一些保密级别较低的鉴定工作被外包。会要求外包人员来公司完成鉴定工作。
在国内市场上,我还没有听说过任何公司倒卖语料库的情况,也没有听说过任何成功的窃听案例。同样,据我所知,智能音箱也不会利用自己听过的语料库来为每个用户形成全景画像。张思成肯定,归根结底,智能音箱还是很蠢,提取有效信息的成本太高。我个人觉得未来3到5年,不需要担心音箱带来的隐私问题。
但和其他从业者一样,他并不否认上述所有尚未发生的情况在未来技术更加成熟的时候可能会发生。
作为这个新兴行业的从业者,张思成已经能够接受平衡技术与隐私的难度。在物联网和人工智能时代,我们没有隐私,也无处可逃。即使没有智能音箱,通过手机和电脑,每个人的个人信息、喜好、习惯等信息早已被各个公司掌握。从本质上来说,这并没有什么不同。
除非未来拥有更强大的计算能力,否则所有智能产品都将在本地计算,全部与互联网断开,仅在更新系统时偶尔连接互联网。张思成认为,对于普通人来说,这种技术难度高、商业价值低的想法太牵强,太不现实。
面对这些焦虑,一些人选择远离智能音箱。一名技术人员表示,他已经彻底切断了家里智能音箱的电源,并没有购买其他智能家居的计划。张思成默默接受了。他买了三四个智能音箱放在家里。它们最初是用于工作测试,后来习惯了它们的存在。
在技术检测隐私的边缘,张思成的底线是不造成伤害。他在客厅和门厅放置了智能扬声器。这样一来,即使一些语音数据被泄露,也不会对他和他的家人造成真正的伤害。智能音箱的声音采集范围约为3~5米,很难穿墙采集。在卧室里基本上听不到。当你们确实有私人话题的时候,就可以拔掉插头来谈论它。
他无法接受的是图像的泄露。我永远不会购买带摄像头的音箱或其他带摄像头的产品放在卧室里。他清楚地认识到,图像一旦泄露,将造成不可挽回的重大危害:不仅有从业者透露,联网摄像设备确实会将图像传回服务器,数据会严格保密,但仍有理论上的泄漏风险。
你无法隐藏自己,所以你只能用最基本的方法来保护自己。 —— 这是张思成的理论。
不过,也有人持较为乐观的态度。智能音箱正处于疯狂增长的初级阶段。当扩展到整个智能家居时,它们都会经历这些初始阶段。此时的隐私保护只能依靠厂商的自律。徐嘉明坚信,当这些产品完全普及后,一定会出现更高级别的隐私法规,统一行业,限制权限,并作为强制性标准来实施。
(文中斯兰、张思成、徐嘉明均为化名)