基于卫星图像得到地面细节照片，生成对抗网络立新功

摘要：地理学家可以用这项技术更便捷地判别土地用途，大大减轻工作强度。

达芬奇有些著名的画作展示了意大利一些地区的鸟瞰图，单从某些细节程度来说，我们很难想象这些画作是在摄影技术和飞行设备发明之前创作出来的，评论家们也都很难解释。不过现在，研究学者更关心这一问题的反向过程——给定卫星图像，对应的地面区域看起来应该是什么样的？这样一种人工构造的图片细节，究竟能有多高的准确度？

如今，来自加州大学默塞德分校的 Xueqing Deng 团队解决了这一问题。他们训练了一种机器学习算法，在观察卫星图片后，就可以生成地面视角的图片。

这项技术基于一种叫做生成对抗网络的模型，这种模型由两大模块组成，一种叫做生成器，另一种叫做判别器。

图|上：网络模型结构和训练过程；下：输入图片、生成图片与真实图片对比结果

以生成长颈鹿的图片为例，生成器先生成一张图像，判别器基于一些学习准则进行评估，比如评估它们与长颈鹿的相似程度，生成器接收判别器反馈的评估结果进行修正。重复这段过程，生成器就能逐渐学会产生像长颈鹿一样的图像。

类似上述例子，Deng 的团队使用地面角度的真实图像和对应区域的卫星图像来训练判别器，这样判别器就会学会如何将卫星图像与对应区域的地面图像关联起来。

当然，数据集的质量同样重要。Deng 的团队使用的是 LCM2015 地面覆盖图，涵盖整个英国, 分辨率达到 1 公里。不过，该团队只运用了包括伦敦和周边乡村在内的 71x71 公里的网格上的数据。他们从一个叫做 Geograph 的在线数据库，下载了网格中的每个位置相应的地面图像。

接下来，该研究团队使用 16000 对卫星图像和地面图像对判别器进行了训练。

下一步就是生成地面图片了。他们把特定位置的一组 4000 张卫星图像输入到生成器，并结合判别器的反馈结果，生成器为每个卫星图像创建了相应位置的地面视图。随后研究团队利用 4000 张卫星图像作为测试数据，把这 4000 张卫星图像经生成器生成的地面图片与真实图片进行比较。

结果非常有趣。如果对图像质量要求不太高的话，网络会产生比较合理的图像。该模型生成的图像捕捉到了一些地面的基本特征，比如某个位置是不是一条路，或者区分出某个区域是农村还是城市等等。“生成的地面图像尽管看起来比较自然，但是正如预期的那样，缺乏真实图片的细节。”Deng 和他的团队说。

这一工作很漂亮，但究竟会有多大作用？地理学家的一项重要任务就是根据土地的用途对土地进行分类，比如，某片土地是农村还是城市。

地面角度的图像就对这项任务非常重要，但是这类数据非常稀缺，尤其是对非城市地区。目前地理学家一般利用插值技术，在图像之间进行插值，结果仅比随机猜测好一点。

现在 Deng 的团队所使用的这项生成对抗网络技术给地理学家们提供了新的方法。当地理学家想知道某个区域的地面视角的图像，他们只需要找到对应位置的卫星图像，利用这种方法生成一些地面视图就可以了。

Deng 的团队比较了插值方法和图像生成方法的结果。这种图像生成的技术最终正确判别了 73% 的土地使用情况，而插值方法的正确率只有 65%。

这是一项很有趣的工作，能够大大减轻地理学家的工作量。不过 Deng 和他的团队有着更大的野心。他们希望进一步改进图像生成过程，以期在未来能够在生成的图片中提供更多的细节特征。即使达芬奇本人也会对这项技术钦佩的。