•  

    智能音箱窃听疑云成真?亚马逊被曝雇佣数千名员工“偷听”

    2019-04-12 09:24:03 来源:互联网
    标签:

     

    目前,数千万的人们经常使用智能扬声器和语音软件来玩游戏、听音乐或搜寻一些琐事。而这其中有数百万人却越来越不愿意将这些设备和它们强大的麦克风买回家,因为他们担心有人在偷听。

     

    有时候,的确有人在偷听。

     

    亚马逊公司在全球雇佣了数千名员工,以帮助改进为Echo音箱供电的Alexa数字语音助手。?#33455;?#23567;组会监听Echo在其主人家中或办公室里收集到的语音记录。这些录音会被转录、注释,然后反馈到软件中,?#21496;?#30340;目的是为了消除Alexa对人类语言理解?#30446;?#30333;,帮助它更好地响应指令。

     

    七名曾参与过Alexa语音审查程序的人员描述这个程序时,强调了在训练软件算法时经常被忽视的人类?#24039;?#22312;营销材料中,亚马逊称Alexa“生活在云端,并且一直在变得更聪明。” 但是,就像许多为了实现从经验中学习的目的而构建的软件工具一样,人类也在?#20113;?#36827;行一些教学。

     

    据知情人?#23458;?#38706;,这个团队由一群承包商和亚马逊全职员工组成,他?#31363;?#27874;士顿、哥斯达黎加、印度和罗马尼亚等地的前哨站工作。这些知情人士签署了保密协议,该协议禁止他们公开谈论这个项目。

     

    亚马逊?#25216;?#21202;斯特办公室的两名员工称,他们每天工作9个小时,每人?#30475;?#24403;值时要分析多达1000个音频片段。?#25216;?#21202;斯特办公室位于罗马尼亚首?#35745;?#20855;发展前景的Pipera区,占据了?#38750;?#20215;值大厦(Globalworth building)最高的三层。办公室里现代化的设备在摇摇欲坠的基础设施中十分显眼,却没有任何外部标志显示亚马逊的存在。

     

    这项工作里的大部分内容?#24049;?#24179;常。波士顿的一名工作人员?#25285;?#20182;为“泰勒·?#38599;?#22827;特”等特定话语挖掘了积累的语音数据,并?#20113;?#36827;行了注释,?#21592;?#26126;搜索者指的是音乐艺术家。

     

    偶尔,这些工作人?#34987;?#21548;到Echo的主人可能比较隐私的内容,?#28909;紓?#19968;个女人在淋浴时唱得很糟糕,或者一个孩子大声呼救。当团队在解析一个混乱的单词时需要帮助或遇到一段有趣的录音时,他们会使用内部聊天室来共享文件。

     

    有时他们会听到令他们不安的录音,或者可能是与犯罪有关的录音。其中两名工人?#25285;?#20182;们听到过他们认为是性侵的录音。当类似的事情发生时,他们可能会在内部聊天室里分享经验,以缓解压力。亚马逊表示,当员工听到令人不快的事情时,他们有相应的程序可以遵循,但两名罗马尼?#31363;?#24037;表示,在这样的情况发生后他们想寻求指导时,却被告知这不是亚马逊的工作。

     

    一位亚马逊发言人在一份电子邮件声明中表示:“我们会严肃?#28304;?#23458;户个人信息的安全和隐私。为了改善用户体验,我们只标注了一小部分Alexa语音录音样本。例如,这些信息可以帮助我们训练我们的语音识别和自然语言理解系?#24120;佣?#20351;得Alexa可?#24895;?#22909;地理解您的请求,并确保服务对每个人都有效。”

     

    声明中还?#25285;?ldquo;我们有严格的技术和操作保障措施,对滥用我们系统的行为采取零容忍政策。员工不能直接访?#39318;?#20026;此工作流一部分的个人或帐户标识信息。所有信息都被高度保密,为了保护这些信息,我们使用多因素身份验证手段来限?#21697;?#38382;、?#29992;?#21644;审核我们?#30446;?#21046;程序。”

     

    亚马逊在其营销和隐私政策材料中没有明确表示,一些人正在监听Alexa收集的对话录音。该公司在一份常见问题列表中表示:“我们利用您对Alexa的要求来训练我们的语音识别和自然语言理解系统。”

     

    在Alexa的隐私设置中,该公司允许用户在开发新功能时禁用语音记录。根据彭博社查看的截图显示,发?#36879;鳤lexa审计员的录音不提供用户的全名?#20599;?#22336;,但是却与账号、用户名和设备序列号相关。

     

    外媒在今年早些时候曾报道称,亚马逊旗下Ring公司的员工通过在公司门铃摄像头拍摄的视频人工识别车辆和人员,据说这是为了更好地训练该软件自己独立完成这项工作。

     

    密歇根大学教授Florian Schaub在?#33455;?#20102;与智能扬声器相关的隐私问题后?#25285;?ldquo;你没有必要总是想着有另一个人正在监听你在家里对你的智能扬声器说了些什?#30784;?#25105;认为,我们已经习惯于这样一种假设,这些机器只?#31363;?#36827;行神奇的机器学习。但事实是,这项工作仍然需要包含人工处理的部分。”

     

    他补充说道:“这是否属于隐私问题,取决于亚马逊和其他公司对他们人工标注的信息类?#20599;?#35880;慎程度,以及他们如何向他人呈现这些信息。”

     

    自2014年Echo问世后,亚马逊的圆柱形智能音箱使得语音软件在家庭中的使用迅速普及。不久后,Alphabet 公司推出了自己的版本“谷歌Home”,随后是?#36824;?#20844;司的HomePod。在中国也有许多公司销售自?#21644;?#20986;的类似设备。根据?#33455;?#26426;构Canalys的数据显示,去年全球消费者购买了7800万个智能扬声器。还有数百万人使用语音软件与智能手机上的数字语音助手进行互动。

     

    Alexa软件被设计成听到一个唤醒词后连续录制音频片段。唤醒词默认是“Alexa”。但人们可?#36234;?#20854;更改为“Echo”或“computer”。当检测?#20132;?#37266;词时,Echo顶部的光环会变为蓝色,表明该设备正在记录并向亚马逊服务器发送一条命令。

     

    大多数现代语音识别系统?#35272;?#20110;模仿人类大脑的神经网络。该软件通过在大量数据中发现模式来学习。驱动Echo和其他智能扬声器的算法使用概率模型来进行有根据的猜测。如果有人问Alexa附近是否有希?#23433;?#39302;,算法就知道用户可能在寻找一家餐馆,而不是教堂或社区中心。

     

    但有时Alexa?#19981;?#24324;错,尤其?#31363;?#22788;理新的俚语、地区口语或英语以外的语言时。在法语中,avec sa的“with him”或“with her”会让软件误以为有人在使用Alexa wake这个词。Hecho在西班牙语中表示事实或行为,有时被误解为Echo。这就是为什么亚马逊?#24515;?#20154;工助手来填补算法所遗漏?#30446;?#30333;。

     

    ?#36824;?#30340;Siri也有人工助手,主要负责判断数字语音助手对请求的解释是否与用户所说的相符。根据?#36824;?#30340;一份安全白皮书所示,他们审查的录音缺乏可识别个人身份的信息,并与随机标识符绑定存储6个月。在此之后,数据将被剔除随机识别信息,但可能会被存储更长时间,以提高Siri的语音识别能力。

     

    该公司?#25285;?#22312;谷歌,一些评估人员可?#28304;?#35895;歌语音助手那里获得一些音频片段,用来帮助训练和改进产品,但它与任何可识别个人身份的信息都没有关联,而且音频是失真的。

     

    亚马逊最近发布了一份招聘启事,为?#25216;?#21202;斯特的Alexa数据服务公司招聘一名?#26102;?#32463;理。招聘启事里对工作内容这样描述:“每天Alexa?#23478;?#21548;成千上万的人谈论不同的话题和不同的语言,她需要我们的帮助来理解这一?#23567;?#36825;是你?#28216;?#35265;过的大数据处理。我们每天都在创造、标注、策划和分析大量的语音材料。”

     

    据一位知情人?#23458;?#38706;,亚马逊对语音数据的审核过程?#21152;贏lexa随机抽取一小部分客户语音记录样本,并将音频文件发?#36879;?#36965;远的员工和承包商。

     

    一些Alexa审核人员的任务是转录用户的命令,将录音与Alexa的自动记录进行比较,或者对用户与机器之间的交互进行注释。这个人问了什么?Alexa是否提供了有效的响应?

     

    另一些人则记下侦听器所听到的一切,包括背景谈话,即使?#31363;?#23401;子们说话的时候。有时侦听器会听到用户讨论诸如姓名或银行信息?#20154;?#20154;?#38468;凇?#22312;这?#26234;?#20917;下,他们应该勾选一个表示“关键数据”的对话框,然后他们进入下一个音频文件。

     

    根据亚马逊网站上的说法,除非Echo检测?#20132;?#37266;词或按下按钮激活,否则不会存储音频。但有时Alexa似乎在没有任何提示的情况下就开始录音了,音频文件?#28304;?#32819;的电视声音或难以理解的噪音开始。无论激活是否错误,审核人员都需要?#20113;?#36827;行转录。其中一名知情人?#20811;担?#24403;Alexa没有收?#20132;?#37266;命令或意外触发时,审核人员每人每天都会录制多达100段录音。

     

    据两位评论人?#20811;担?#22312;世界各地的家庭中,Echo的主人经常猜测谁在偷听。他们会问Alexa :“你是为国家安全局工作吗?Alexa,有人在听我们说话吗?”

     

     
    关注与非网微信 ( ee-focus )
    限量版产业观察、行业动态、技术大餐每日推荐
    享受快时代的精品慢阅读
     

     

    继续阅读
    亚马逊不会退出中国,单关停卖家服务

    这可能是亚马逊少有的一次调整,自被媒体曝出其要“退出中国”的消息后,亚马逊在华正经历着“冰火两重天”的?#36710;亍?#19968;方面Kindle和全球开店等业务依旧坚挺,另一方面即将关停亚马逊中国网站第三方卖家服务。

    亚马逊在中国没有欲望?

    4月18日下午,亚马逊中国位于?#26412;?#36828;洋国际的办公室外,已经有多名物业保安驻守。他们是当天临时接到的任务,要?#20013;?#39547;守多长时间还不得而知。大楼的气氛骤然紧张起来,?#27604;?#19978;午,亚马逊中国刚刚在公司内部宣?#23478;?#22312;中国区裁员的消息。

    亚马逊的中国衰落史

    贝索斯对中国市场越来越无能为力了,这次他想通了,退出吧,不耗了。 近日,针对“亚马逊主营业务电商退出中国市场”的消息,亚马逊表示将于2019年7月18日停止为亚马逊中国网站上的第三方卖家提供卖家服务。

    中国再无亚马逊
    中国再无亚马逊

    过去的15年,是中国电商的?#24179;?5年,却是国际电商巨头亚马逊在中国失意的15年。

    云服务四大巨头实力?#21592;齲?#20122;马逊是参天大树,阿里云是小树苗
    云服务四大巨头实力?#21592;齲?#20122;马逊是参天大树,阿里云是小树苗

    全球四大云巨头营收规模?#21592;齲?#20122;马逊AWS是参天大树,而阿里云则是一个小树苗。亚马逊AWS在2018年创造了1700亿元人民币营收,而阿里云为213.6亿。

    更多资讯
    什么样的人工智能生态才是适合中国的?

    中国有哪些优势?需要怎样的人工智能创新生态?#20811;?#30528;近期国家层面?#34987;?#20986;台一系列人工智能发?#26500;?#21010;和举措,我国人工智能发展脉络更加清晰、生态更加优化。

    今天安兔兔微博公布了三星Galaxy Fold的跑分,显示综合跑分为36万分,三星Galaxy Fold搭载了骁龙855处理器,跑出这个分数属于正常水平,现在搭载骁龙855的旗舰机?#22242;?#20998;在37万分左右。

    别急着用5G手机,大规模使用还有?#38382;?#38388;
    别急着用5G手机,大规模使用还有?#38382;?#38388;

    5G手机目前已经拉开了序幕,现在已经有几家厂商正式发布了5G机型,在2019年年底前,预计大部分手机品牌都会在这方面秀一下肌肉,甚?#30103;还?#20026;了不在5G方面落后,已经与高通方面和解。

    三?#23884;?#20110;自家的折叠手机?#25925;?#38750;常谨慎的,或许是还不太完善,所以在此前的发布会上一直不肯让媒体上手。在经过几个月的?#21364;?#20043;后,没想到三星Galaxy Fold?#25925;?#32763;车了。从外媒测试的反馈来看,很多问题都出现在?#32842;?#19978;,三?#19988;?#34920;示会积极解决问题。

    TikTok走下神?#24120;?#30701;视频业务成了“成也萧何败萧何”
    TikTok走下神?#24120;?#30701;视频业务成了“成也萧何败萧何”

    印度市场之于中国科技企?#25285;?#26082;是流?#39318;拍?#19982;蜜的应许之地,?#24425;且?#24471;无数英雄竟折腰风光险峰。

    电路方案
    北京十一选五走势图