这篇论文也是利用深度学习计算两张图片之间 homography 矩阵的方法。与前文的方法(Deep Image Homography Estimation、Unsupervised Deep Homography)不同的是输出层为 perspective field,也就是每一个像素的变换关系。在有了每个像素的变换关系以后,便能使用 DLT 计算 homography 矩阵,并且也会比只用四个点还要 robust。
以下为本文的架构图:
其中用到的 blocks 都在上图介绍了。本方法的 loss function 是拿估计的 perspective field 与 ground-truth 的 perspective 做比较:
