论文阅读《Parallax Attention for Unsupervised Stereo Correspondence Learning》
迪丽瓦拉
2025-05-31 17:22:39
0

论文地址:https://ieeexplore.ieee.org/document/9206116
源码地址:https://github.com/The-Learning-And-Vision-Atelier-LAVA/PAM


概述

  不同数据集的视图之间的基线、焦距与分辨率不同,基于Cost Volume固定预设视差范围的立体匹配方法无法很好处理大视差预测问题。为此,作者提出一个基于视差注意力机制的立体匹配方法来捕捉大视差范围的匹配点的信息,通过将极线约束与注意力机制结合,计算沿着极线方向的特征相似度来获取匹配点之间的匹配关系。


模型架构

Formulation:在图像自注意力机制中,将特征图从 RH×W×C\mathbb{R}^{H \times W \times C}RH×W×C 转换为 RHW×C\mathbb{R}^{HW \times C}RHW×C 后进行矩阵相乘( RHW×C×RC×HW\mathbb{R}^{HW \times C} \times \mathbb{R}^{C \times HW}RHW×C×RC×HW )来得到像素之间的注意力。受到自注意力机制的启发,PAM 基于极限约束来求左右视图极线之间的注意力,如图3所示:
在这里插入图片描述
  给定左右特征图 A,B∈RH×W×CA, B \in \mathbb{R^{H\times W\times C}}A,B∈RH×W×C,使用 1×11\times 11×1 的卷积进行特征通道融合,继而进行维度转换得 Q∈RH×W×CQ\in \mathbb{R^{H \times W\times C}}Q∈RH×W×C 与 K∈RH×C×WK\in \mathbb{R^{H\times C\times W}}K∈RH×C×W。将 QQQ 与 KKK 矩阵相乘后经过softmax层得到极线注意力图 MB⟶A∈H×W×WM_{B\longrightarrow A \in \mathbb{H\times W\times W}}MB⟶A∈H×W×W​。将 B 经过另外一个 1×11\times 11×1 卷积层后得到 R∈RH×W×C\mathbf{R} \in \mathbb{R}^{H\times W\times C}R∈RH×W×C,然后将 MB⟶A∈H×W×WM_{B\longrightarrow A} \in \mathbb{H\times W\times W}MB⟶A​∈H×W×W 与 R\mathbf{R}R 相乘后得到输出特征图 O∈RH×W×CO\in \mathbb{R}^{H\times W\times C}O∈RH×W×C,同时使用 MB⟶A∈H×W×WM_{B\longrightarrow A} \in \mathbb{H\times W\times W}MB⟶A​∈H×W×W 生成 Mask VBV_BVB​。

示例:给定尺寸为 30×3030\times 3030×30 的左右图像 Ileft\mathbf{I}_{left}Ileft​ 与 Iright\mathbf{I}_{right}Iright​,可以使用PAM来生成对应的视差注意力图 Mleft⟶rightM_{left\longrightarrow right}Mleft⟶right​ 与 Mright⟶left∈R30×30×30M_{right\longrightarrow left}\in \mathbb{R^{30\times 30 \times 30}}Mright⟶left​∈R30×30×30。
在这里插入图片描述
  其中,图4中第一行为左右视差图,第二行为对应的视差注意力图,图4(a)或图4(b)中的视差注意力图的第一列为Mright⟶leftM_{right\longrightarrow left}Mright⟶left​,其中横方向为右图的索引,纵轴为左图的索引,现在只考虑黄线(左右图像的第 iii 行),。如果左右图像是完全匹配的(视差为0),则生成的注意力图像如图4(a) 第二行所示,只有对角线上的元素为1,即Mright⟶left(i,j,j)=1M_{right\longrightarrow left}(i, j, j)=1Mright⟶left​(i,j,j)=1,代表左图第iii 行的第jjj 个像素Ileft(i,j)\mathbf{I}_{left}(i, j)Ileft​(i,j) 与 右图第iii 行第jjj 个像素Iright(i,j)\mathbf{I}_{right}(i, j)Iright​(i,j) 匹配上了。在视差不为0的区域,图4(b)所示,如视差为5的区域,表示左图第iii 行的第jjj 个像素Ileft(i,j)\mathbf{I}_{left}(i, j)Ileft​(i,j) 与 右图第iii 行第j−5j-5j−5 个像素Iright(i,j−5)\mathbf{I}_{right}(i, j-5)Iright​(i,j−5) 匹配上了,即Mright⟶left(i,j,j−5)=1M_{right\longrightarrow left}(i, j, j-5)=1Mright⟶left​(i,j,j−5)=1。
  同时可以从视差注意力图中得到遮挡图,如图4(b) 第一列中,某些列中没有激活点,说明在右图中的 jjj 点在左图中没有匹配点,即该点在左图中被遮挡。如果某一行没有激活点,则导表该点在右图中没有匹配点,在右图中被遮挡。

左右一致性与循环一致性:为了得到可靠的一致性匹配结果,使用左右一致性与循环一致性来对PAM模块进行正则化。给定左右视图 Ileft\mathbf{I}_{left}Ileft​ 与 Iright\mathbf{I}_{right}Iright​ 与 Mleft⟶rightM_{left\longrightarrow right}Mleft⟶right​ 与 Mright⟶leftM_{right\longrightarrow left}Mright⟶left​,有:
{Ileft =Mright →left ⊗Iright ,Iright =Mleft →right ⊗Ileft (1)\left\{\begin{aligned} \mathbf{I}_{\text {left }} & =\mathbf{M}_{\text {right } \rightarrow \text { left }} \otimes \mathbf{I}_{\text {right }}, \\ \mathbf{I}_{\text {right }} & =\mathbf{M}_{\text {left } \rightarrow \text { right }} \otimes \mathbf{I}_{\text {left }} \end{aligned}\right.\tag{1}{Ileft ​Iright ​​=Mright → left ​⊗Iright ​,=Mleft → right ​⊗Ileft ​​(1)
其中 ⊗\otimes⊗ 表示带有几何感知的矩阵乘法,同理,循环一致性表示为:
{Ileft =Mleft →right →left ⊗Ileft ,Iright =Mright →left →right ⊗Iright(2)\left\{\begin{aligned} \mathbf{I}_{\text {left }} & =\mathbf{M}_{\text {left } \rightarrow \text {right } \rightarrow \text { left }} \otimes \mathbf{I}_{\text {left }}, \\ \mathbf{I}_{\text {right }} & =\mathbf{M}_{\text {right } \rightarrow \text {left } \rightarrow \text { right }} \otimes \mathbf{I}_{\text {right}} \end{aligned}\right.\tag{2}{Ileft ​Iright ​​=Mleft →right → left ​⊗Ileft ​,=Mright →left → right ​⊗Iright​​(2)
其中循环注意力图计算如下:
{Mleft →right →left=Mright →left ⊗Mleft →right Mright →left →right =Mleft →right ⊗Mright →left (3)\left\{\begin{array}{rl} \mathbf{M}_{\text {left } \rightarrow \text { right } \rightarrow l e f t} & =\mathbf{M}_{\text {right } \rightarrow \text { left }} \otimes \mathbf{M}_{\text {left } \rightarrow \text { right }} \\ \mathbf{M}_{\text {right } \rightarrow \text { left } \rightarrow \text { right }} & =\mathbf{M}_{\text {left } \rightarrow \text { right }} \otimes \mathbf{M}_{\text {right } \rightarrow \text { left }} \end{array} \right.\tag{3}{Mleft → right →left​Mright → left → right ​​=Mright → left ​⊗Mleft → right ​=Mleft → right ​⊗Mright → left ​​(3)
其中,⊗\otimes⊗ 表示矩阵乘法,对于第 iii 行,Mright →left (i,:,:)∈RW×W\mathbf{M}_{\text {right } \rightarrow \text { left }}(i, :, :)\in \mathbb{R}^{W\times W}Mright → left ​(i,:,:)∈RW×W与 Iright(i,:,:)∈W×C\mathbf{I}_{right}(i, :, :)\in \mathbb{W\times C}Iright​(i,:,:)∈W×C 相乘的结果为第 iii 行的每个特征,将 WWW 行的结果拼接得到 Ileft∈RH×W×C\mathbf{I}_{left}\in \mathbb{R}^{H\times W\times C}Ileft​∈RH×W×C。

有效值掩码:左右一致性与循环一致性都未包含遮挡区域的信息,文中使用视差注意力图来生成有效区域掩码,只在有效区域进行正则化,有效掩码如下图所示:
Vleft (i,k)={1,if ∑j∈[1,W]Mleft→right(i,j,k)>τ0,otherwise (4)\mathbf{V}_{\text {left }}(i, k)=\left\{\begin{array}{ll} 1, & \text { if } \sum_{j \in[1, W]} \mathbf{M}_{l e f t \rightarrow r i g h t}(i, j, k)>\tau \\ 0, & \text { otherwise } \end{array}\right.\tag{4}Vleft ​(i,k)={1,0,​ if ∑j∈[1,W]​Mleft→right​(i,j,k)>τ otherwise ​(4)
在这里插入图片描述

层叠式视差-注意力模块

  层叠注意力模块包含3个stages,每个stage包含4个视差注意力blocks,如图7(b)所示:
在这里插入图片描述
   通过沙漏网络提取到的左右视图的特征图大小为 Fleft1\mathbf{F^1_{left}}Fleft1​ ,Fright1∈RH16×W16×C\mathbf{F^1_{right}}\in \mathbb{R}^{\frac{H}{16}\times \frac{W}{16}\times C}Fright1​∈R16H​×16W​×C与初始代价 Cright→left0C^0_{right \rightarrow left}Cright→left0​,Cright→left0∈RH16×W16×W16C^0_{right \rightarrow left }\in \mathbb{R}^{\frac{H}{16}\times \frac{W}{16}\times \frac{W}{16}}Cright→left0​∈R16H​×16W​×16W​ (初始化为0)。使用 3×33\times 33×3 的卷积处理 Fleftl\mathbf{F}^l_{left}Fleftl​ 与 Frightl\mathbf{F}^l_{right}Frightl​ 后得到 Fleft\mathbf{F}_{left}Fleft​ 与 Fright\mathbf{F}_{right}Fright​。然后使用 1×11\times 11×1 的卷积层处理 Fleft\mathbf{F}_{left}Fleft​ 与 Fright\mathbf{F}_{right}Fright​ 后得到 Q\mathbf{Q}Q 与 K\mathbf{K}K, reshape后相乘得到 Cright→left1∈RH16×W16×W16C^1_{right \rightarrow left }\in \mathbb{R}^{\frac{H}{16}\times \frac{W}{16}\times \frac{W}{16}}Cright→left1​∈R16H​×16W​×16W​。交换Fleft1\mathbf{F^1_{left}}Fleft1​ ,Fright1\mathbf{F^1_{right}}Fright1​ 后生成 Cleft→right1∈RH16×W16×W16C^1_{left \rightarrow right }\in \mathbb{R}^{\frac{H}{16}\times \frac{W}{16}\times \frac{W}{16}}Cleft→right1​∈R16H​×16W​×16W​。如图7(b) 所示,将生成的结果送入后续的block中继续生成新的特征图与 CCC。在每个stage之后进行双线性插值到上一层后继续迭代。得到最后的得分矩阵 C3C^3C3。
   模型通过层叠式视差-注意力模块完成隐式正则化,如图8所示:
在这里插入图片描述
  为了简化分析,在此过程中只考虑 3×33\times 33×3 的卷积操作。在第 mthm^{th}mth 的视差注意力 block 中, 左右视图fleft5\mathbf{f}^5_{left}fleft5​ 与 fright5\mathbf{f}^5_{right}fright5​之间cost c5,5mc^m_{5,5}c5,5m​ 计算如式5所示:
c5,5m=c5,5m−1+(wQmfleft 5)TwKmfright 5=c5,5m−1+(fleft 5)T(wQm)TwKmfright 5,=c5,5m−1+Ψm(fleft 5,fright 5)(5)\begin{aligned} c_{5,5}^{m} & =c_{5,5}^{m-1}+\left(\mathbf{w}_{Q}^{m} \mathbf{f}_{\text {left }}^{5}\right)^{\mathrm{T}} \mathbf{w}_{K}^{m} \mathbf{f}_{\text {right }}^{5} \\ & =c_{5,5}^{m-1}+\left(\mathbf{f}_{\text {left }}^{5}\right)^{\mathrm{T}}\left(\mathbf{w}_{Q}^{m}\right)^{\mathrm{T}} \mathbf{w}_{K}^{m} \mathbf{f}_{\text {right }}^{5}, \\ & =c_{5,5}^{m-1}+\Psi^{m}\left(\mathbf{f}_{\text {left }}^{5}, \mathbf{f}_{\text {right }}^{5}\right) \end{aligned}\tag{5}c5,5m​​=c5,5m−1​+(wQm​fleft 5​)TwKm​fright 5​=c5,5m−1​+(fleft 5​)T(wQm​)TwKm​fright 5​,=c5,5m−1​+Ψm(fleft 5​,fright 5​)​(5)
其中 wQmw_Q^mwQm​, wKm∈RC×Cw_K^m\in \mathbb{R}^{C\times C}wKm​∈RC×C 为 1×11\times 11×1 的卷积层,fleft5\mathbf{f}^5_{left}fleft5​ 与 fright5∈RC×1\mathbf{f}^5_{right}\in \mathbb{R}^{C\times 1}fright5​∈RC×1 为匹配点的特征。 Ψm\Psi^{m}Ψm 为输入特征对之间的匹配代价。在 (m+1)th(m+1)^{th}(m+1)th 层block的特征向量由第 mthm^{th}mth 层特征向量fleft\mathbf{f}_{left}fleft​ 与 fright\mathbf{f}_{right}fright​的局部邻域聚合而来:
{fleft =∑i=19wifleft ifright =∑j=19wjfright j,(6)\left\{\begin{array}{rl} \mathbf{f}_{\text {left }} & =\sum_{i=1}^{9} \mathbf{w}^{i} \mathbf{f}_{\text {left }}^{i} \\ \mathbf{f}_{\text {right }} & =\sum_{j=1}^{9} \mathbf{w}^{j} \mathbf{f}_{\text {right }}^{j} \end{array},\right.\tag{6}{fleft ​fright ​​=∑i=19​wifleft i​=∑j=19​wjfright j​​,(6)
其中 wi\mathbf{w}^{i}wi 与 wj∈RC×C\mathbf{w}^{j}\in \mathbb{R}^{C\times C}wj∈RC×C 为权值共享的 3×33\times 33×3 的卷积操作。fleft\mathbf{f}_{left}fleft​ 与 fright∈RC×C\mathbf{f}_{right}\in \mathbb{R}^{C\times C}fright​∈RC×C为输出特征向量,匹配代价计算如式7所示:
c5,5m+1=c5,5m+(wQm+1fleft )TwKm+1fright =c5,5m+∑i∑j(wQm+1wifleft i)TwKm+1wjfright j=c5,5m+∑i∑j(flefti)T(wi)T(wQm+1)TwKm+1wjfright j,=c5,5m+∑i∑jΨi,jm+1(flefti,fright j)(7)\begin{aligned} c_{5,5}^{m+1} & =c_{5,5}^{m}+\left(\mathbf{w}_{Q}^{m+1} \mathbf{f}_{\text {left }}\right)^{\mathrm{T}} \mathbf{w}_{K}^{m+1} \mathbf{f}_{\text {right }} \\ & =c_{5,5}^{m}+\sum_{i} \sum_{j}\left(\mathbf{w}_{Q}^{m+1} \mathbf{w}^{i} \mathbf{f}_{\text {left }}^{i}\right)^{\mathrm{T}} \mathbf{w}_{K}^{m+1} \mathbf{w}^{j} \mathbf{f}_{\text {right }}^{j} \\ & =c_{5,5}^{m}+\sum_{i} \sum_{j}\left(\mathbf{f}_{l e f t}^{i}\right)^{\mathrm{T}}\left(\mathbf{w}^{i}\right)^{\mathrm{T}}\left(\mathbf{w}_{Q}^{m+1}\right)^{\mathrm{T}} \mathbf{w}_{K}^{m+1} \mathbf{w}^{j} \mathbf{f}_{\text {right }}^{j}, \\ & =c_{5,5}^{m}+\sum_{i} \sum_{j} \Psi_{i, j}^{m+1}\left(\mathbf{f}_{l e f t}^{i}, \mathbf{f}_{\text {right }}^{j}\right) \end{aligned}\tag{7}c5,5m+1​​=c5,5m​+(wQm+1​fleft ​)TwKm+1​fright ​=c5,5m​+i∑​j∑​(wQm+1​wifleft i​)TwKm+1​wjfright j​=c5,5m​+i∑​j∑​(flefti​)T(wi)T(wQm+1​)TwKm+1​wjfright j​,=c5,5m​+i∑​j∑​Ψi,jm+1​(flefti​,fright j​)​(7)
求中 wQm+1\mathbf{w}_{Q}^{m+1}wQm+1​, wKm+1∈RC×C\mathbf{w}_{K}^{m+1}\in \mathbb{R}^{C\times C}wKm+1​∈RC×C 为两个 1×11\times 11×1 的卷积层。 Ψi,jm+1(.)\Psi_{i, j}^{m+1}(.)Ψi,jm+1​(.) 为输入特征对之间的匹配代价。从事7中可以看出,在从 mthm^{th}mth 到 mth+1m^{th+1}mth+1 层的过程中完成了隐式的代价聚合。

视差回归

由stage 3 得到的Cright→left3\mathbf{C}^3_{right \rightarrow left}Cright→left3​ 和 Cleft→right3\mathbf{C}^3_{left \rightarrow right}Cleft→right3​ 经过softmax层得 Mright→left3\mathbf{M}^3_{right \rightarrow left}Mright→left3​ 和 Mleft→right3∈RH4×W4×W4\mathbf{M}^3_{left \rightarrow right} \in \mathbb{R}^{\frac{H}{4} \times \frac{W}{4} \times \frac{W}{4}}Mleft→right3​∈R4H​×4W​×4W​, 如图7(c)所示。继而使用Mleft→right3\mathbf{M}^3_{left \rightarrow right}Mleft→right3​, Mright→left3\mathbf{M}^3_{right \rightarrow left}Mright→left3​ 生成有效值掩码 Vleft3\mathbf{V}^3_{left}Vleft3​ 和 Vright3\mathbf{V}^3_{right}Vright3​,最后回归视差值:
D^=∑k=0W/4−1k×Mright 3left (:,:,k)(8)\hat{\mathbf{D}}=\sum_{k=0}^{W / 4-1} k \times \mathbf{M}_{\text {right }}^{3} \text { left }(:,:, k)\tag{8}D^=k=0∑W/4−1​k×Mright 3​ left (:,:,k)(8)

视差细化

  如图7a所示,使用初始视差值 D^\hat{\mathbf{D}}D^ 与 Fleft4\mathbf{F}_{left}^4Fleft4​ 拼接后送入沙漏网络中生成视差的残差图 D^res\hat{\mathbf{D}}_{res}D^res​ 与置信度图 Mcon\mathbf{M}_{con}Mcon​:
D^refined =(1−Mcon )×D^ini ↑+Mcon ×D^res (9)\hat{\mathbf{D}}_{\text {refined }}=\left(1-\mathbf{M}_{\text {con }}\right) \times \hat{\mathbf{D}}_{\text {ini }} \uparrow+\mathbf{M}_{\text {con }} \times \hat{\mathbf{D}}_{\text {res }}\tag{9}D^refined ​=(1−Mcon ​)×D^ini ​↑+Mcon ​×D^res ​(9)
其中 ↑\uparrow↑ 为上采样操作。


损失函数

光度损失:

Lp=1N∑p∈Vleft α1−S(Ileft(p),I^(p))2+(1−α)∥Ileft (p)−I^(p)∥1,(10)\mathcal{L}_{\mathrm{p}}=\frac{1}{N} \sum_{p \in \mathbf{V}_{\text {left }}} \alpha \frac{1-\mathcal{S}\left(\mathbf{I}_{l e f t}(p), \hat{\mathbf{I}}(p)\right)}{2}+(1-\alpha)\left\|\mathbf{I}_{\text {left }}(p)-\hat{\mathbf{I}}(p)\right\|_{1},\tag{10}Lp​=N1​p∈Vleft ​∑​α21−S(Ileft​(p),I^(p))​+(1−α)​Ileft ​(p)−I^(p)​1​,(10)

平滑损失:

Ls=1N∑p(∥∇xD^refined (p)∥1e−∥∇xIleft(p)∥1+∥∇yD^refined (p)∥1e−∥∇yIleft(p)∥1),(11)\begin{array}{l} \mathcal{L}_{\mathrm{s}}= \frac{1}{N} \sum_{p}\left(\left\|\nabla_{x} \hat{\mathbf{D}}_{\text {refined }}(p)\right\|_{1} e^{-\left\|\nabla_{x} \mathbf{I}_{l e f t}(p)\right\|_{1}}\right. \\ +\left\|\nabla_{y} \hat{\mathbf{D}}_{\text {refined }}(p)\right\|_{1} e^{\left.-\left\|\nabla_{y} \mathbf{I}_{l e f t}(p)\right\|_{1}\right),} \end{array}\tag{11}Ls​=N1​∑p​(​∇x​D^refined ​(p)​1​e−∥∇x​Ileft​(p)∥1​+​∇y​D^refined ​(p)​1​e−∥∇y​Ileft​(p)∥1​),​(11)

PAM Loss:

   使用3个额外的损失来对不同尺度下的PAM模块正则化:
LPAM s=LPAM-p s+λPAM-s LPAM-s s+λPAM-c LPAM-c s.(12)\mathcal{L}_{\text {PAM }}^{s}=\mathcal{L}_{\text {PAM-p }}^{s}+\lambda_{\text {PAM-s }} \mathcal{L}_{\text {PAM-s }}^{s}+\lambda_{\text {PAM-c }} \mathcal{L}_{\text {PAM-c }}^{s} .\tag{12}LPAM s​=LPAM-p s​+λPAM-s ​LPAM-s s​+λPAM-c ​LPAM-c s​.(12)

  基于视差注意力图的光度一致性损失:
LPAM-p s=1Nleft s∑p∈Vleft s∥Ileft s(p)−(Mright →eft s⊗Iright s)(p)∥1+1Nright s∑p∈Vright s∥Iright s(p)−(Mleft →rights⊗Ileft s)(p)∥1.(13)\begin{aligned} \mathcal{L}_{\text {PAM-p }}^{s}= & \frac{1}{N_{\text {left }}^{s}} \sum_{p \in \mathbf{V}_{\text {left }}^{s}}\left\|\mathbf{I}_{\text {left }}^{s}(p)-\left(\mathbf{M}_{\text {right } \rightarrow \text { eft }}^{s} \otimes \mathbf{I}_{\text {right }}^{s}\right)(p)\right\|_{1} & +\frac{1}{N_{\text {right }}^{s}} \sum_{p \in \mathbf{V}_{\text {right }}^{s}}\left\|\mathbf{I}_{\text {right }}^{s}(p)-\left(\mathbf{M}_{\text {left } \rightarrow r i g h t}^{s} \otimes \mathbf{I}_{\text {left }}^{s}\right)(p)\right\|_{1} . \end{aligned}\tag{13}LPAM-p s​=​Nleft s​1​p∈Vleft s​∑​​Ileft s​(p)−(Mright → eft s​⊗Iright s​)(p)​1​​+Nright s​1​p∈Vright s​∑​​Iright s​(p)−(Mleft →rights​⊗Ileft s​)(p)​1​.​(13)

  基于视差注意力图的平滑性损失:
LPAM−ss=1Ns∑Ms∑i,j,k(∥Ms(i,j,k)−Ms(i+1,j,k)∥1+∥Ms(i,j,k)−Ms(i,j+1,k+1)∥1),(14)\begin{aligned} \mathcal{L}_{\mathrm{PAM}-\mathrm{s}}^{s}= & \frac{1}{N^{s}} \sum_{\mathbf{M}^{s}} \sum_{i, j, k}\left(\left\|\mathbf{M}^{s}(i, j, k)-\mathbf{M}^{s}(i+1, j, k)\right\|_{1}\right. & \left.+\left\|\mathbf{M}^{s}(i, j, k)-\mathbf{M}^{s}(i, j+1, k+1)\right\|_{1}\right), \end{aligned}\tag{14}LPAM−ss​=​Ns1​Ms∑​i,j,k∑​(∥Ms(i,j,k)−Ms(i+1,j,k)∥1​​+∥Ms(i,j,k)−Ms(i,j+1,k+1)∥1​),​(14)

  循环一致性损失:
LPAM−cs=1Nleft s∑p∈Vleft s∥Mleft →right→lefts(p)−Is(p)∥1+1Nright s∑p∈Vright s∥Mright →left →rights(p)−Is(p)∥1,(15)\begin{aligned} \mathcal{L}_{\mathrm{PAM}-\mathrm{c}}^{s}= & \frac{1}{N_{\text {left }}^{s}} \sum_{p \in \mathbf{V}_{\text {left }}^{s}}\left\|\mathbf{M}_{\text {left } \rightarrow r i g h t \rightarrow l e f t}^{s}(p)-I^{s}(p)\right\|_{1} & +\frac{1}{N_{\text {right }}^{s}} \sum_{p \in \mathbf{V}_{\text {right }}^{s}}\left\|\mathbf{M}_{\text {right } \rightarrow \text { left } \rightarrow r i g h t}^{s}(p)-I^{s}(p)\right\|_{1}, \end{aligned}\tag{15}LPAM−cs​=​Nleft s​1​p∈Vleft s​∑​​Mleft →right→lefts​(p)−Is(p)​1​​+Nright s​1​p∈Vright s​∑​​Mright → left →rights​(p)−Is(p)​1​,​(15)

Lunsup =Lp+λsLs+λPAM (0.2LPAM 1+0.3LPAM 2+0.5LPAM 3).(16)\begin{aligned} \mathcal{L}_{\text {unsup }}= & \mathcal{L}_{\mathrm{p}}+\lambda_{\mathrm{s}} \mathcal{L}_{\mathrm{s}} +\lambda_{\text {PAM }}\left(0.2 \mathcal{L}_{\text {PAM }}^{1}+0.3 \mathcal{L}_{\text {PAM }}^{2}+0.5 \mathcal{L}_{\text {PAM }}^{3}\right) . \end{aligned}\tag{16}Lunsup ​=​Lp​+λs​Ls​+λPAM ​(0.2LPAM 1​+0.3LPAM 2​+0.5LPAM 3​).​(16)


实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...