Speech2Face是人工智能研究人员开发的一爱游戏ayx体育项新人工智能技术,仅通过听一个人的声音就能预测他的脸。
麻省理工学院(MIT)研究了一个人的长相是否可以从他的言语中推爱游戏ayx体育断出来的问题。因此,他们启动了一个项目,训练一种算法,使其仅通过听一个人说话就能建立一个人最具识别性的身体特征。
“我们的模型旨在揭示训练数据中面部特征和说话者声音之间的统计相关性。”Speech2Face的创建者说.
“我们使用的培训数据是YouTube上的教育视频的集合,不能平等地代表整个世界人口。因此,该模型——就像任何机器学习模型一样——都会受到数据分布不均匀的影响。”
他们开发的人工智能被称为Speech2Face,它可以通过重现人类几秒钟的演讲来创建与人类非常相似的合成面部特征。
但这项技术究竟是如何工作的呢?爱游戏ayx体育
Speech2Face基于一个神经网络系统,该系统可以识别包括种族、年龄和性别在内的人类特征。结果,在训练她掌握演讲和YouTube视频中数千人的脸之间的联系后,speech2Face收集了一系列参考资料,使他能够在不使用图像的情况下生成一张脸。
人工智能的绝对惊人之处在于它能够生成与人类非常接近的虚拟面孔。然而,它们没有使用人工智能将合成人脸与真实人脸图像进行比较得出的结果那么精确。Speech2Face的目标是构建一个恢复与语音相关的物理方面的图片。
Speech2Face从演讲中生成头像,这与AI不同。他们通常使用学习系统创建人工智能,这些学习系统具有与真人相似的特征,而人类无法区分。
将来我们也许能从这种新的智能中获益。使用基本音频来构建犯罪档案是最有效的用途之一。
不幸的是,也有一些缺点。例如,一个人做鬼脸的容易程度有可能被用来模仿某人。另一方面,引入这种经过训练的人工智能是一项巨大的技术进步。