谷歌旗下人工智能部门“谷歌大脑”设计了一款全新软件,可以把马赛克一样的源图片还原成清晰图片。简而言之,原本“打码”的照片现在也可以轻松变成无码高清了。
首先来看一张图,左边一列是分辨率为8×8的打码图片,中间一列是谷歌大脑软件还原的图片,而右边一列则是真正的原始图片。实际效果非常接近原始图片。
众所周知,不可能制作出比源图片更加详细的图片,那么谷歌大脑是如何做到的呢?他们将两个神经网络聪明地整合到一起。
第一部分是条件网络(conditioning network),它会将8×8的图片与高清图片进行对比,将其他高清图片缩小到8×8的分辨率,然后进行匹配。
第二部分是优先网络(prior network),使用PixelCNN(像素神经网络)向8×8的源图片中增加真实的高清细节。在这个案例中,优先网络其实是吸收了大量名人和卧室照片。然后,当需要解析源图片时,便会从其已知的图片中寻找与之匹配的新像素,并将添加进去。
例如,图片顶部有一个棕色像素,而优先网络或许认为那是一条眉毛:于是,当要解析图片时,就会用眉毛形状的棕色像素填补进去。
为了制作出最终的无码高清图片,需要融合这两个神经网络输出的数据,最终结果往往会包含一些似是而非的新细节。
谷歌大脑的高清还原技术已经在实际测试中取得了一定的成功。当该团队向人类观察员呈现真实的高清明星照和经过电脑还原的照片时,观察员被骗的比例达到10%(50%就属于完美得分)。而在卧室照片中,人类观察员被骗的比例达到28%。这两个得分都远高于常规的双三次插值放大技术,后者没有骗过任何人类观察员。
需要指出的是,电脑还原的高清图片并非真实图片,它所增加的细节只是一种“猜测”。这便引发了一些有趣的问题,尤其是在监控和法医领域。这项技术可以把模糊的嫌疑人照片放大成更加清晰的图片,但却无法得到真正的嫌疑人照片,但仍然可以为警方提供一些帮助。
谷歌大脑和DeepMind是Alphabet的两大深度学习研究机构。前者最近发布了一些有趣的研究成果,例如,开发了可以自行制作加密算法的人工智能技术。后者则因为其开发的AlphaGo去年击败全球顶级围棋选手李世石而名声大噪。