Deepfake基本概述
Deepfakes一词起源于Reddit在线论坛,该论坛使用深度学习算法以数字方式将名人的面孔叠加到色情影片中的人们的面孔上。这种Deepfake技术基于生成的对抗网络(GAN),该网络经过训练可复制某些模式(例如名人的面孔),并逐渐增强人工合成面孔的真实感。
Deepfake是深度学习和伪造的结合,深度学习模型将使用包含视频或音频样本的大型标签数据集进行训练,直到达到可接受的准确性水平。通过适当的训练,该模型将能够合成与训练数据高度匹配的面部或声音,可以仿造某人的视频,当它像PS一样普及的时候,将会深刻影响社会的方方方面。
通过使用AI技术,Deepfake音频被认为是最先进的网络攻击形式之一。实际上,最近的研究表明,可以用不到四秒钟的源音频开发出令人信服的克隆语音。在此较小的时间范围内,可能会产生创建令人信服的深层虚假所必需的所有可区分的个人语音特征,例如发音,速度,语调,音调和共鸣,以馈入算法。但是,源音频和训练样本越多,输出的说服力就越大。
与制作Deepfake视频相比,deepfake音频更可扩展且难以检测。检测音频深层伪造需要训练计算机以侦听听不到的暗示,即声音不可能来自真实的人。
Deepfake音频要求通过将训练数据和采样音频输入适当的算法来创建素材。该材料可以包含目标的多个音频片段,这些音频片段通常是从公共资源中收集的,例如演讲,演示,访谈,公开电话,窃听和公司视频,其中许多都是免费提供的线上。
通过使用语音合成,可以轻松创建语音模型,并能够以与目标实体相同的语调,节奏和方式读出文本。有些产品甚至允许用户选择任何性别和年龄的声音,而不是模仿预期的目标。这种方法有可能允许与目标进行实时对话或交互,这将进一步阻碍对任何恶意活动的检测。
Deepfake的检测算法永远不够
检测需要专业人士专业分析,而制造仅仅需要几个小时,会出现一种无奈现象,你的检测方式刚发布,可能相应的规避方式就会出现。一些检测算法识别率能达到九成以上,但即使一小部分也无法估计它的破坏力。如果个人电脑被入侵,黑客可以创作一个虚拟的你,欺骗你的朋友和家人,如果你是某个企业或政府部门人员,会造成更大的损失。
Deepfake技术在发展,未来关于此类案件应该会频发,技术应用到假新闻,抹黑公众人物,或是运用到色情,诈骗等领域。在中国应该会是严控它的普及,但人们对它没有安全意识,更容易相信一些虚假的视频,低案发率,高成功率或许是未来现状。
希望中国的安全圈子变的开放起来,普及网络安全,中国互联网在高速发展,网络对生活的渗透越来越深,未来物联网,大数据,人工智能,网络安全越来复杂,需要安全企业技术革新,也需要普通人的网络安全意识提高,去面对不那么乐观的网络安全环境。