现代科技最引人注目的进步之一是机器视觉的兴起。在短短的几年间,新一代的机器学习技术已经改变了计算机对图像的识别方法。现在,机器在人脸识别和物体识别方面已超越了人类并且彻底改变了大量的基于视觉的任务,比如驾驶、安全监控等等。机器视觉现在已具有超人的能力。
但据麻省理工《技术评论》报道,来自谷歌和OpenAI研究所的研究人员发现了机器视觉算法的一个弱点:机器视觉会被一些经过修改的图像干扰,而人类可以很容易地发现这些图像的修改之处。
研究人员指出:“一例子是对人脸图像打上非常细微的标记,人类依然可以正确地识别出图像中人物的身份,但机器学习系统会把他们识别成其他人”。研究人员对此进行了系统的研究,揭示了机器视觉系统的弱点。研究团队一开始使用了ImageNet,该数据库的图像根据其显示的内容被分类;研究人员首先使用该数据库的一部分图像来训练一个机器算法,然后用另一部分图像来评估算法是否能良好地进行分类。研究团队用三种不同的方式修改了5万张来自ImageNet的图片,从而创造了一个对比图像数据库。第一种算法对图像进行了较小的改变从而最大化这项交叉熵,第二种算法是将这个过程迭代来进一步地改变某张图像,第三项算法改变了某张图像从而能控制机器视觉系统,并让其出现某种特定的分类错误。研究团队测试Google的Inception v3算法能否正确地对这些图像进行分类,结果发现前两种算法大幅度地降低了精确度,但是第三种算法将所有图像的精确度减小至零。
这项研究揭示了机器视觉的阿喀琉斯之踵,未来还有很多值得研究的内容。研究人员希望为其他类型的视觉系统开发比较图像,从而使这些系统更有效率。