学界通过流量识别加密视频内容以色列学者提源泉
深度学习在数据特征识别上的能力强大,目前已成为计算机视觉、图像处理、语音识别、自然语言处理等领域的流行方法。最近,研究人员又尝试将深度学习应用到了络攻击中。利用视频流量分析,以色列特拉维夫大学和康奈尔大学的研究者们开发的新算法只需在电脑或浏览器中加入几行 JavaScript 代码,就能在这台设备连接到 Wi-Fi 后通过流量数据识别出用户观看的视频内容,而识别准确率接近 100%。
电视剧《黑镜》中的又一项技术被科学家们部分实现了
目前,研究人员的算法已经可以识别目标用户在 Netflix、Youtube、亚马逊视频等平台上观看的视频内容,他们可以通过络在远程完成这项工作,只需用户(或者相同局域内的其他用户)浏览经过适当制作的站。这种方法无需直接访问食品本身,也不用访问正在播放视频的设备,研究人员表示,从路由器、络服务供应商到站都可以通过这种方式窥探人们的隐私。
论文:Beauty and the Burst: Remote Identification of Encrypted Video Streams
论文链接:
美是在观察者眼中产生的,因此,为了获得我们观察到的东西,我们需要四处搜集我们所喜爱的东西。时至今日,很多我们观察到的东西是以互联上的视频形式出现的,而且我们对电影、电视节目、、社交媒体视频的选择往往揭露了我们的个性、喜好、社会经济状况和心情。很多机构都渴望开发这些信息:广告商家、保险机构、定价商或者去惩罚那些访问不良信息的人。
络传输加密技术给这些监控设置了障碍,但是我们知道络传输分析,只能检查络传输的规模和时序,而对于传输的内容,通常需要进行归纳分析。怎样对加密的视频进行有效的流量分析?对于潜在的对手而言,这又有多容易呢?
我们提出了一种非常有效的方法,它有关攻击者(attacker)如何用直接和间接的方法对目标用户观看的视频内容进行分析的(通过像 Netflix 和 YouTube 这样的流媒体)。我们考虑了三类攻击情景:
路径攻击(On-path attacks),最简单的方法,包括一个可以被动监控用户流量的对手。这包括互联服务供应商,恶意 Wi-Fi 接入点、代理、VPN、路由器等。它们可以对完全精确地看到单个数据包,并且通过我们的方法,它们可以辨认出用户正在观看的加密视频是什么。
跨站攻击(Cross-site attacks),攻击者的唯一一次访问就是通过受害者的浏览器来发送 javascript 代码(如下图)。这是一个相当危险的方法:现在,那些对用户访问习惯有着浓厚商业兴趣的操作者无处不在,那些不受信任的 Javascript 代码通常出自他们之手。浏览器可能会在一个被限制的环境中运行这些代码,来防止其搜寻个人信息。但我们的研究展示了这种限制是失败的:攻击者可以通过一个旁路通道(side channel)来访问络视频传输:他会用自己的数据来冲毁络连接,然后在络阻塞的时候去测量其波动。几分钟后,他们就可以对视频进行推断性的分析。
跨设备攻击(cross-device attacks):这是一种更强大的识别流量模式的方法。比如,一个在自己的电视上观看 Netflix 视频的用户可能会被碰巧运行在其本地络中的某台电脑上的一个浏览器中的 JavaScript 代码攻击(参见下图)。这种攻击也依赖于归纳和测量该流媒体设备和 PC 在共同络连接上的拥塞(congestion)。
为了基于记录的流量模式识别视频,我们使用了深度学习技术,并使用几种领先的流媒体服务上的电影内容训练了一个人工神经络系统。这种神经络视频分类器的训练过程类似于用户将视频传输到其流媒体设备(或软件)的过程,并且连接到相似的流媒体服务。当被训练识别数十个标题时,我们的 YouTube 检测器实现了 0 负例,回调为 0.988,而 Netflix 检测器的负例率为 0.0005,回调为 0.93.
QA
对于这项技术,研究者们还对一些人们关心的问题进行了解答。
Q1:哪些流媒体服务会被探测?
A:我们测试了四种热度最高的视频服务:Netflix、YouTube、Amazon Video 和 Vimeo,发现所有这些都很容易受到我们的视频识别技术的影响。通常,流媒体服务使用 MPEG-DASH 标准运行在 HTTP(S)上,而 MPEG-DASH 的分段机制让信息泄露变得简单。具体原因将在 Q6 中讨论。以上所有四种服务在测试中都具有危险性:YouTube 直接使用标准方式,而 Amazon Video、Netflix 和 Vimeo 使用了非常接近的变体。
第一代iPhone就像是一块没什么用处的砖头。Q2:流量信息如何泄露?
A:从恶意 WiFi 接入点、代理、路由器、公司络、国家级关和 ISP 都可以用来获取用户观看视频习惯的信息。无线关可以使用这些信息来屏蔽受监控的内容,即使它们已被加密。
用户访问的所有络内容提供商(包括广告、分析提供者和社交络)也可能通过利用我们的侧信道攻击来破坏用户隐私。
Q3:VBR 与视频内容的关系?
A:使用可变比特率压缩(VBR)编码可以让视频在给定质量的前提下存储空间最小。这种方式高度依赖于视频内容。例如:视频鬣蜥与蛇之间多动作场景需要高比特率来表示。下图展示了视频在不同场景中比特率的波动。
示例视频:
Q4:什么是流量突发特征?它与视频内容有什么联系?
A:在 MPEG-DASH 视频流中,服务器上的视频会被分割为小段传送到客户端处。这就导致
临沧哪家医院看白癜风南京男科治疗医院
宿迁白癜风
- 12-29[玄幻]凡事靠自己,能解决人生80%的关键问题
- 12-26[玄幻]为什么荨麻疹总喜欢“赖上你”?眼疾荨麻疹后,需做好5个护理工作
- 12-24[玄幻]宣医科普|O型血真是是“万能血”吗?
- 12-24[玄幻]一个约定塑造出跨越数千里的“父女”情
- 12-24[玄幻]在向领导汇报工作的时候,注意三不提,否则你的关键时刻很惨
- 12-16[玄幻]时越,连胜芈昱廷陈耀烨两位主将,终不敌卫冕冠军出局!
- 12-13[玄幻]她毕业9年「抠」出两套房:工资存90%,衣服鞋子全靠捡,已婚已育不做礼拜,我真服了!
- 12-03[玄幻]女人别再想到这些傻事了,你感动不了男人,只会作践了自己!
- 11-27[玄幻]夜的第七章被抢注成标识
- 11-27[玄幻]北京市疾控中心:这4类技术人员须立即主动报备
- 11-24[玄幻]梁咏琪、炎明熹细腻合唱《勇》,一个历经千帆,一个洁白如初
- 11-15[玄幻]高考“沁芳”引爆传统文化风潮
- 11-14[玄幻]上海11万初三同学重回校园