拥有更好初始化猜测的GPU加速高分图像拼接

GPU-accelerated high-resolution image stitching with better initial guess

高分辨率图像处理对于虚拟现实中的新兴应用至关重要。鲁棒性/准确性和速度之间的权衡对高分辨率图像拼接提出了挑战。本文通过使用 CUDA 工具包加速了最先进的图像拼接算法。我们还使用网格坐标作为求解翘曲函数的初始猜测,以进一步提高速度。实验结果表明,我们的实现实现了与最先进工作相当的质量,而我们的实现在高分辨率图像(3264×2448)上快了近 2 倍。

Ⅰ 介绍

动机:VR设备的普及以及分辨率地不断提高,高分辨图像处理在未来变得至关重要。用于创建虚拟环境的全景图像拼接是 VR 应用的必要图像处理技术。质量和速度之间的权衡是图像拼接算法的一个重要问题。

作者使用了用于特征匹配的 GPU 加速并行实现和用于求解扭曲函数的更好的初始猜测。实验结果表明,我们的实现在高分辨率图像上几乎比原始 C++ 实现快2倍(3264\times2448),但仍保留原始质量。

系统整体框架

Ⅱ 相关工作

  • AutoStitch:不能满足VR全景渲染;
  • APAP:全局投影但允许局部非投影偏差以获得更好图像对齐;

这些方法的大量计算成本会增加运行时间,然而对于VR而言,图像的质量和拼接速度都很重要。

Ⅳ 方法

第一步:找到可能相邻的图像。给定N张图像I_1,\space I_2,\space \cdots\space,\space I_N,这一步给所有图像生成SIFT描述子,然后计算它们描述子之间的距离。若距离小于阈值,系统根据匹配对的数量确定全景中最可能相邻的图像对。

第二步:基于网格的变形。应用APAP生成基于网格的扭曲函数,初始网格坐标{\bf V}和一系列匹配点对导致网格变形,最佳网格坐标{\tilde{\bf V}}由能量函数决定。
{ \tilde{\bf V}}=\arg\min_{{\tilde{\bf V}}}{\bf \Psi}_a\left({\bf V}\right)+{\bf \Psi}_s\left({\bf V}\right)
其中{\bf \Psi}_a \left({\bf V}\right){\bf \Psi }_s \left( {\bf V} \right)分别表示对齐项和相似项。

第三步:确定最佳比例和旋转角度。系统首先估计相机内参、焦距、像素大小和偏移信息等。然后通过SVD方法求解得到3D旋转矩阵和旋转角度,用于网格优化。最后使用旋转矩阵对图像进行扭曲缝合产生全景图。

A. 剖析

为了确定拼接过程中哪个步骤比较耗时,采用Profiler分析,如下表所示。特征匹配、解翘曲函数、尺度和旋转选择消耗了大部分运行时间,作者专注于改善这一部分的加速实现。

各部分耗时剖析结果
B. GPU加速并行实现

当描述符的维度很高(通常大于 500)时,内存访问变得耗时。当对向量或矩阵执行算术运算时,GPU 可以有效地访问设备内存。为了充分利用 CUDA 中的并行性,我们将距离计算转换为基本的向量和矩阵运算。

图像I_iI_j分别检测到pq个特征点:{\bf A} = \left[{\bf x}_1,{\bf x}_2,\cdots,{\bf x}_p\right]{\bf B} = \left[{\bf y}_1,{\bf y}_2,\cdots,{\bf y}_q\right],每个特征点的维数为K维。{\bf A}的第一列为{ \bf x}_1A\left(k,1\right)={\bf x}_1\left(k\right)1\leq k\leq K

两个特征点之间的距离为:
\begin{align*} d^{2}&=\Vert \mathbf{x}_{\mathbf{p}}-\mathbf{y}_{\mathbf{q}}\Vert_{2}^{2}\\ =& \sum_{k=1}^{K}(A(k,p)-B(k,\ q))^{2}\\ =& \sum_{k=1}^{K}A(k,p)^{2}-2M(p,\ q)+\sum_{k=1}^{K}B(k,\ q)^{2}\\ =&\Vert \mathbf{x}_{\mathbf{p}}\Vert_{2}^{2}-2M(p,\ q)+\Vert \text{y}_{\text{q}}\Vert_{2}^{2},\ where\ M=A^{T}B\\ \tag{1} \end{align*}
基本线性代数子程序 (BLAS) 是执行基本向量和矩阵运算,cuBLAS 库是 BLAS 的快速 GPU 加速实现。\Vert \mathbf{x}_{\mathbf{p}}\Vert_{2}^{2}\Vert \mathbf{y}_{\mathbf{q}}\Vert_{2}^{2}可以由cuBLAS级别 2 例程并行计算,A^{T}B可以由cuBLAS级别 3 例程并行计算。

C. 更好初始猜测

作者先确定图像I_iI_j重叠部分中I_i的网格坐标,收集匹配点M_{ij},在chen的方法中,使用x=0初始化寻找使能量函数最小的{\tilde{\bf V}},作者用{\bf V}进行初始化,使迭代次数更少,加速拟合。

迭代150次的中间结果,左图为作者提出的更好初始化的方法,右图为chen的方法

Ⅳ 实验结果

作者在不同分辨率下分别实现了 31.6%、35.2%、41.7% 的运行时间改进。值得注意的是,输入图像尺寸越大,提出的加速技术就越有效。

Ⅴ 结论

人们认为,针对高分辨率图像的稳健且快速的图像拼接方法是 VR 中新兴应用的关键。在本文中,我们提出了用于特征匹配的 GPU 加速并行实现和更好的初始猜测来解决扭曲函数,以加快最先进的图像拼接方法。实验结果表明,我们的实现比原始实现快了近 2 倍,同时保留了高分辨率图像(3264×2448)上的原始全景质量。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,287评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,346评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,277评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,132评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,147评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,106评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,019评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,862评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,301评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,521评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,682评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,405评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,996评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,651评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,803评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,674评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,563评论 2 352

推荐阅读更多精彩内容

  • 摘要: 本文根据并行计算在图像融合上的应用简单概述了一些国内的基于并行计算的图像融合算法。在概述之前相对图像融合和...
    岑封远望阅读 695评论 0 0
  • 国科创(北京)信息技术有限公司-近年来,随着中国航天事业的快速发展,国产高分辨率遥感卫星也得到了快速发展,一批批高...
    国科创阅读 4,329评论 0 0
  • 某些情况下,我们需要处理同一图像的不同分辨率的图像。例如,当搜索图像中的某个对象(如人脸)时,我们不确定该对象在图...
    sumpig阅读 583评论 0 0
  • HRNetV2 应该是一系列论文,按时间顺序是: 0.前身:HRNetV1,用于人体姿态估计 Deep High-...
    Valar_Morghulis阅读 1,202评论 0 0
  • 图像分类解决了是什么的问题,目标检测解决了在哪里的问题。简单来说就是在图像分类的基础上,以包围盒的(boundin...
    Byte猫阅读 7,062评论 0 11