计算机多媒体技术视差估计,面向立体视频的视差

《面向立体视频的视差_运动同步联立预测算法》由会员分享，可在线阅读，更多相关《面向立体视频的视差_运动同步联立预测算法(6页珍藏版)》请在技术文库上搜索。

1、第 22 卷第 10 期 2010 年 10月计算机辅助设计与图形学学报 Journal of Computer-Aided Design 修回日期: 2010-03-10. 基金项目: 国家自然科学基金( 30970780) . 邓智玭( 1983) ) , 女, 博士研究生, 主要研究方向为多视点视频编码、视频检索等; 贾克斌( 1961) ) , 男, 博士, 教授, 博士生导师, 主要研究方向为多媒体信息处理、图像和视频技术等; 陈锐霖( 1971) ) ,男, 博士, 副教授,博士生导师, 主要研究方向为信息处理、视频编码等; 伏长虹( 1981) ) , 男, 博士, 主要研。

2、究方向为视频技术等; 萧允治( 1954) ) , 男, 博士, 教授, 博士生导师, 主要研究方向为数字信号处理、图像和视频技术等.面向立体视频的视差 -运动同步联立预测算法邓智玭1), 贾克斌1), 陈锐霖2), 伏长虹2), 萧允治2)1)( 北京工业大学电子信息与控制工程学院北京 100124)2)( 香港理工大学电子资讯工程系香港)( dzhipin emails. bjut. edu. cn)摘要: 针对立体视频序列的时间空间冗余和交叉冗余, 提出一种快速编码算法. 应用立体 -运动约束模型在视差域和运动域进行联合迭代搜索, 根据每次迭代后的模型误差设置自适应修正窗口来保证预。

3、测矢量精度, 视差矢量和运动矢量可以快速同步获得. 实验结果表明, 该算法在保证高率失真性能的同时, 可以大幅度降低编码复杂度.关键词: 立体视频编码; 3D 视频; 视差估计; 运动估计中图法分类号: TP391A Simultaneous Motion and Disparity Estimation for Stereoscopic Video CodingDeng Zhipin1), Jia Kebin1), Yu- i Lam Chan2), Chang -Hong Fu2), and Wan -Chi Siu2)1)(Dep artment of Electronic Inf or。

4、mation 3D video; disparity estimation; motion estimation立体视频蕴含景物的深度信息, 在自然场景的表征上更具有真实感, 在 3D 电视、移动设备的立体视觉系统以及具有临场感的可视会议等领域展现了广阔的应用前景 1 -2. 传统的立体视频压缩通过全搜索算法在视点内和视点间的参考帧中分别进行运动和视差估计, 以消除同一视点内部的时间空间冗余和左右视点之间的交叉冗余 3 -5. 这种算法在得到高率失真性能的同时带来了巨大的运算量, 限制了立体视频的实时应用. 针对立体视频编码中复杂度最高的运动和视差估计, 已有的快速算法大体可分为两大。

5、类: 1) 基于预测矢量的编码算法. 先用全搜索算法对某一域( 视差域或运动域) 计算视差或运动矢量, 然后利用/ 立体视频对0在相邻时刻视差矢量的一致性或者相邻视点运动矢量一致性原理, 对另一域( 运动域或视差域) 采用快速算法进行预测 6 -7. 这类算法虽然能得到较好的编码性能, 但是由于下一域( 运动域或视差域) 预测矢量的准确性取决于前一域( 视差域或运动域) 的预测结果, 因此前一域往往采用穷尽的全搜索算法来保证结果的准确性, 编码速度仍然有待提高. 2) 运动和视差联合估计算法. 根据立体视频的序列相关性原理, 运动域和视差域的信息可以互相利用, 由相邻图像的运动和视差矢量。

6、关系直接预测得到当前块的运动( 视差) 矢量, 从而最大限度降低编码复杂度 8 -10. 但是, 目前这类算法的研究大多只针对像素域或者基于 MPEG 标准, 不能与当前主流的基于块的H.264P AVC视频编码标准兼容, 而且直接利用相邻图像的运动和视差矢量关系求得预测矢量容易陷入局部极小值, 编码质量得不到保证.本文基于 H. 264P AVC 标准, 提出一种基于立体 -运动约束模型的视差 -运动同步联立预测算法.该算法有效地结合运动域和视差域矢量预测, 设计迭代搜索策略对候选预测值进行修正, 并且设计自适应搜索窗口来避免陷入局部极小值, 能够快速同步搜索得到最佳运动和视差矢量.图。

7、1 立体视频编码结构1 立体 -运动约束模型立体视频包含左右两路视点, 如图 1 所示. 通常, 左视点首先独立编码, 称为基本视点; 右视点中除第一帧之外的 P 帧既要参考该视点内的前一帧做运动估计, 又要参考左视点相同时刻的对应帧进行视差估计. 令 Fl, t和 Fr, t分别表示左右视点 t 时刻的图像对, Il, t: Fl, tyR和 Ir, t: Fr, tyR分别为 Fl, t和Fr, t的亮度映射,R为实值有界函数, Fl, tAR2, Fr, tA R2. t 时刻左右视点图像对之间的视差域由映射Dr, t: Fl, tyFr, t表示. 那么, 立体视频对的视差估计过程可。

8、以归结为求Q QFr,t+Ir, t- Il, t. Dr, t+的最小值, 即根据同一图像内部相邻块亮度一致性的原理, 在预测初值附近设定一个搜索窗口, 搜索得到与当前块相似度最大的匹配块, 匹配块和当前块之间的位移就是视差矢量. 立体视频相邻 2 个图像对的 4 个预测矢量(2 个运动矢量, 2 个视差矢量)存在线性约束关系 8, 即 mr, t+ dr, t - 1= dr, t+ ml, t, 其中, mr, t和ml, t 分别表示当前块和当前块在 Fl, t中对应块的运动矢量, dr, t和dr, t- 1分别表示当前块和当前块在右视点前一帧 Fr, t- 1中对应块的视差矢量.。

9、根据该立体-运动约束模型, 右视点 t 时刻的图像中当前块的运动矢量 mr, tP 视差矢量 dr, t可以由同一视点前一时刻图像对应块的视差矢量 dr, t- 1, 以及相同时刻左视点图像对应块上的运动矢量 ml, t来预测得到.2 本文算法2. 1 改进的预测初值确定规则大多数运动估计快速算法都采用中值矢量来进行预测, 即利用当前块的左边块(A )、上边块(B) 和右上块(C)运动矢量的中值来作为预测初值, 并在这个初值点周围做运动搜索以得到最佳运动矢量.但是, 立体视频编码采用视点和时间方向的多参考帧预测技术, 传统的中值矢量预测算法由于不考虑相邻块的参考帧方向, 将会引入误差.。

10、例如, 若当前块正在进行同一视点时间方向的运动估计, 而相邻块 A, B, C 都由视点方向的参考帧来预测得到, 在这种情况下, 根据传统的中值矢量预测方法, 当前块的运动矢量预测初值仍然由 A, B, C 的视差矢量取中值得到, 即相邻块的视差矢量将被用来作为候选值得到运动矢量初值. 在立体视频编码中, 运动矢量和视差矢量是 2 个完全不同的概念, 视差偏移量有时甚至会超过 100 个像素, 而运动矢量一般来说较小, 所以由相邻块的视差矢量取中值得到运动矢量的预测初值, 将导致运动矢量严重偏差.本文采用改进的中值矢量算法, 在选取中值矢量之前先判断当前块和相邻块的参考帧方向. 只有相邻块的。

11、参考帧方向(时间或视点方向) 和当前块的预测方向相同时, 才能被用来计算当前块的中值矢量. 进一步, 为了保证搜索起始点的准确性, 在确定运动(视差)矢量预测初值时, 本文将改进的中值矢量与零矢量 0 、当前块在参考帧中相同位置块的预测矢量、相邻块(A , B, C)的预测矢量进行比较, 从中选取使率失真代价( rate distortion cost, RDCost) 最小的矢量作为当前块运动( 视差) 矢量的预测初值.2. 2 由最大覆盖面积原理求对应块由于在 H.264 中, 每幅图像都是以块为单位进1710计算机辅助设计与图形学学报第 22 卷行编码的, 而当前块在时间-视点方向。

12、参考帧中的运动-视差补偿块通常会覆盖最多 4 个已编码块, 如图 2 所示. 其中, Fr, t- 1和 Fl, t分别为当前帧 Fr, t在时间方向和视点方向的参考帧, MCMB 表示运动补偿块, DCMB 表示视差补偿块. 假设 MBr, t为当前块,MCMBr, t- 1(mr, t)为 MBr, t在 Fr, t- 1中的运动补偿块,DCMBl, t( dr, t) 为 MBr, t在 Fl, t中的视差补偿块. 由图 2 可以看到, MCMBr, t - 1( mr, t) 和 DCMBl, t( dr, t)各覆盖了 4个已编码块(图中标记为 1, 2, 3, 4), 而 4个被覆。

13、盖的已编码块各有一个预测矢量. 因此, 如何回溯得到一个更准确的预测矢量来表征运动补偿块MCMBr, t- 1(mr, t) 的视差矢量 dr, t - 1( MCMBr, t- 1),以及视差补偿块 DCMBl, t( dr, t) 的运动矢量ml, t(DCMBl, t), 将直接影响算法的有效性. 本文利用被覆盖面积最大的块作为主导块来求取预测矢量(如图 2 中的灰色块), 即分别将 Fr, t - 1P Fl, t中主导块的预测矢量作为 dr, t- 1(MCMBr, t- 1)P ml, t(DCMBl, t).图 2 相邻图像对间的运动和视差矢量关系利用最大覆盖面。

14、积原理求取对应块能在很大程度上缓解由基于块的预测方法带来的不足, 但是dr, t- 1(MCMBr, t- 1)P ml, t( DCMBl, t) 仍与真实的运动(视差)矢量存在一定的差距, 尤其是在运动遮挡区域, DCMBl, t- 1(dr, t- 1) 和 MCMBl, t - 1(ml, t) 在左视点t- 1 时刻的图像帧 Fl, t - 1中往往不能汇聚于同一点. 因此, 立体-运动约束模型将转变成+mr, t( MBr, t) + dr, t- 1(MCMBr, t- 1) -dr, t(MBr, t) - ml, t(DCMBl, t) + = D(1)其中 D是由基于块的编。

15、码方法引入的模型误差,当且仅当运动和视差补偿块正好完全覆盖整个宏块, 并且 MBr, t, MCMBr, t- 1(mr, t), DCMBl, t( dr, t),MCMBl, t- 1(ml, t), DCMBl, t - 1( dr, t - 1) 为同一个物体在不同图像表面的真实汇聚点时, D = 0.2. 3 迭代搜索策略根据立体 -运动约束模型, 当前编码块的运动( 视差) 矢量可以由相邻图像对的另外 3 个预测矢量通过线性运算得到, 运算复杂度可以大幅降低. 但是直接利用立体 -运动约束模型求取运动和视差矢量,得到的当前块在各个参考帧中的运动和视差补偿块并不一定是同一个物体在不同。

16、图像表面的真实汇聚点, 由此造成的错误延续将导致编码质量明显降低.因此, 本文提出一种迭代搜索策略, 利用立体 -运动约束模型在时间和视点方向的参考帧中进行多次迭代, 不断更新运动和视差矢量候选值, 并且在候选值周围进行小范围的矢量修正来保证搜索精度. 该迭代过程对运动矢量和视差矢量同时进行预测, 首先由前一次运动( 视差) 估计得到候选矢量, 然后采用立体 -运动约束模型得到下一次视差( 运动) 估计的搜索起始点, 通过判断 RDCost 来不断更新当前的最优预测矢量. 经过若干次迭代搜索, 当前块的最佳运动和视差矢量能够同步获得. 与传统的全搜索算法中将运动估计和视差估计分成 2 个独立步。

17、骤进行预测的方式相比, 该迭代策略能够大大减少运动和视差估计的复杂度.图 3 自适应修正搜索窗口以避免陷入局部极小值然而, 在一些运动 -视差遮挡区域, 小范围的矢量修正仍然避免不了陷入局部极小值的风险. 如图 3所示, 假设利用立体 -运动约束模型经过多次迭代之后的预测矢量候选值位于 A , 那么, 修正搜索窗口如果小于 - 6, + 6 , 修正之后的预测矢量将位于 B,下一次迭代之后仍然很可能达不到实际的全局最小值 C. 解决此问题的一个有效途径是采用自适应的修正搜索窗口, 通过判断预测矢量候选值的准确性来自适应地调整修正搜索范围. 通常, 搜索窗口越大, 得到精确搜索结果的可能性越大,。

18、从而弥补预测初值的不足, 避免由预测初值不准确而导致的误匹配现象, 但是这样会带来较大的运算量. 反过来说,1711第 10 期邓智玭, 等: 面向立体视频的视差 -运动同步联立预测算法如果搜索起始点足够准确, 那么小的搜索窗口就可以得到准确的搜索结果. 本文根据式( 1) 得到的模型误差 D来决定自适应修正搜索窗口( RSR)的大小, D越大, 则说明需要更大的搜索窗口来获得准确的预测矢量, 如图 4 所示. 当 D T H2时, 说明当前块为异常块, 则采用本文的基于立体-运动约束模型的快速算法很可能得不到最佳预测矢量, 因此令 RSR=RSRMAX, 采用全搜索算法来保证编码质量; 如。

19、果D TH2(2)图 4 自适应修正窗口设计原理该算法利用模型误差将编码块分成 3 种类型,分别采用不同大小的修正搜索窗口对预测矢量候选值进行修正, 并采用全搜索算法确保异常块的预测矢量精确性, 以防止陷入局部极小值, 能够有效地避免由立体-运动约束模型误差造成的错误延续问题.综上所述, 本文提出的基于立体-运动约束模型的视差-运动同步联立预测算法流程如下.假设右视点 t 时刻图像中的宏块 MBr, t为当前块, 令 D = 0, 迭代次数 i= 1.Step1. 初始化. 确定运动和视差矢量的搜索起始点 pm0r, t和 pd0r, t,pm0r, t( MBr, t) = ml, t, 0。

20、, median, lef t, top, top-right ,pd0r, t( MBr, t) = dr, t- 1, 0, median, lef t, top, top-right;其中, ml, t和dr, t- 1分别指当前块在视点和时间方向参考帧中相同位置块的运动和视差矢量, 0 表示零矢量, median 表示改进的中值矢量, lef t 表示当前块的左边相邻块 A , top 表示当前块的上边相邻块 B, top-right 表示当前块的右上方相邻块 C; 并在起始点附近做 ? 2 的矢量修正, 得到最佳预测初值 m0r, t和 d0r, t, 保存率失真代价 RDCost(。

21、 m0r, t)和 RDCost(d0r,t).Step2. 根据 D的大小, 由式( 2) 调整搜索窗口 RSR.Step3. 根据最大覆盖面积原理找到当前块在时间方向参考帧中的对应块, 进而回溯得到该对应块的视差矢量 dir, t- 1,根据立体-运动约束模型求取视差矢量候选值pdir, t( MBr, t)= mi- 1r, t(MBr, t) +dir, t- 1( MBr,t+ mi- 1r, t( MBr, t) )-mi- 1l, t( MBr, t+ di r,t( MBr, t) , i1;并在视点方向参考帧中以 pdir, t为中心做 ? RSR 的矢量修正, 得到视差矢量。

22、 dir, t, 保存 RDCost( dir,t) .Step4. 比较 RDCost( dir, t) 和 RDCost( di- 1r, t) , 选取使率失真代价 RDCost 值较小的矢量作为dir, t.Step5. 根据最大覆盖面积原则, 通过 dir, t做视差补偿,找到当前块在视点方向参考帧中的对应块, 进而回溯得到该对应块的运动矢量 mil, t. 求运动矢量候选值pmir,t( MBr, t)= dir, t(MBr, t)+ mil, t(MBr, t+ dir, t( MBr,t) )-dir, t- 1( MBr, t+ mi- 1r, t(MBr, t) ), i。

23、1;并在视点方向参考帧中以 pmir, t为中心? RSR 的矢量修正得到修正后的视差矢量 mir,t, 保存 RDCost(mir, t) .Step6. 比较 RDCost( mir, t)和 RDCost( mi- 1r,t) , 选取使率失真代价 RDCost 较小的作为 mir, t.Step7. 根据式(1)重新计算 D , 更新 D值.Step8.如果 RDCost ( mir, t) = RDCost ( mi- 1r, t) , 并且RDCost(dir,t)= RDCost(di- 1r, t), 则 mir, t和 dir, t已经是当前块的最佳运动矢量和视差矢量, 。

24、搜索结束; 否则, i= i+ 1, 转 Step2.3 实验结果和分析为了验证本文算法的有效性, 我们将本文算法和多视点视频标准编码模型( JMVM) 全搜索算法、文献 7 以及文献 11 的快速算法进行比较. 实验平台为 JMVM8.0 12, 运动 -视差估计搜索范围为? 32,宏块模式为 Inter16 16, 分别对 Ballroom, Exit,Vassar, Race1 和 Rena 视点 0, 视点 1 各取 100 帧图像进行编码, 各序列分辨率均为 640 480. 实验参数和实验条件均依照文献 13 公布的多视点视频编码测试条件进行. 量化参数 QP 分别取 22, 。

25、27, 32 和 37. 所有实验在配置为 Intel( R) Core( TM) 2 ExtremeX9650 2.99GHz CPU, 4GB RAM 的 PC 机上独立执行.表 1 所示为 4 种算法的编码结果比较. 图 5 所示为 Ballroom 序列对 4 种算法的率失真曲线示意.从表 1 可以看出, 本文算法与 JMVM 全搜索算法相比, PSNR 的变化在- 0.33 dB 到+ 0.01dB 之间, 平均码率( Bitrate) 变化范围在- 10. 93% + 0.07%之间, 并且本文算法能够节省 96% 以上的编码时1712计算机辅助设计与图形学学报第 22 卷间。

26、. 另外, 本文算法的编码质量不亚于文献 7, 11 算法, 并且编码速度大大优于文献 7, 11 算法, 这是由于本文算法同时应用在运动估计和视差估计中, 而不是像文献 7, 11 算法那样, 先做全搜索的运动或视差估计来保证预测精度, 再做快速视差或运动估计.表 1 3种算法的编码结果与 JMVM 全搜索算法比较测试序列QPJMVM 全搜索算法文献 7文献 11本文算法BitratePk比特 P sPSNRP dB时间P s$BitrateP%$PSN RP dB$ 时间P %$BitrateP %$PSN RP dB$ 时间P%$BitrateP %$PSN RP dB$ 时间P %。

27、BallroomExitVassarRace1Rena225113. 1341. 552692+ 2. 120. 00- 47. 33+ 2. 32+ 0. 01 - 49. 74 + 0. 01+ 0. 01 - 96. 17271756. 2138. 522673+ 4. 31- 0. 02- 47. 40+ 5. 38- 0. 02 - 49. 76 - 0. 72- 0. 02 - 96. 2632807. 7835. 702663+ 7. 03- 0. 03- 47. 54 + 10. 12- 0. 05 - 49. 76 - 1. 05- 0. 05 - 96. 3637443. 。

28、2832. 972655+ 7. 89- 0. 05- 47. 65 + 17. 37- 0. 08 - 49. 68 - 2. 10- 0. 06 - 96. 42223414. 6542. 002681- 1. 66- 0. 02- 47. 22+ 2. 30- 0. 02 - 49. 42 - 1. 12- 0. 02 - 96. 1627764. 9339. 602663+ 0. 89- 0. 01- 47. 50 + 11. 69- 0. 07 - 49. 79 - 1. 88- 0. 06 - 96. 3632279. 4037. 502646+ 1. 01- 0. 04- 47.。

29、 54 + 12. 71- 0. 12 - 49. 89 - 2. 28- 0. 13 - 96. 4937152. 7435. 392632- 0. 06- 0. 06- 47. 53 + 18. 21- 0. 22 - 49. 77 - 3. 35- 0. 20 - 96. 54225114. 4041. 332814- 0. 02- 0. 00- 48. 19+ 0. 22+ 0. 00 - 49. 15 + 0. 07- 0. 00 - 96. 59271233. 6538. 022771+ 0. 26- 0. 00- 48. 18+ 1. 51+ 0. 00 - 49. 19 - 0。

30、. 15- 0. 00 - 96. 6832207. 8435. 452750+ 0. 91- 0. 00- 48. 22+ 6. 40- 0. 06 - 49. 24 - 0. 28- 0. 03 - 96. 803787. 9233. 392734+ 0. 04- 0. 00- 48. 17 + 11. 84- 0. 08 - 49. 31 - 1. 14- 0. 05 - 96. 85224107. 1042. 652551- 1. 80+ 0. 01- 46. 88+ 0. 29+ 0. 00 - 49. 63 - 1. 75+ 0. 01 - 96. 08272018. 6139. 。

31、482540- 3. 90- 0. 00- 46. 89+ 0. 26- 0. 03 - 49. 65 - 4. 25- 0. 01 - 96. 1032954. 3936. 222529- 4. 30- 0. 02- 47. 01+ 4. 07- 0. 07 - 49. 58 - 5. 94- 0. 05 - 96. 1637519. 2533. 432516- 6. 98- 0. 05- 47. 14+ 9. 28- 0. 12 - 49. 40 - 10. 93- 0. 12 - 96. 22221565. 9745. 702697- 0. 50- 0. 01- 47. 72+ 1. 4。

32、6- 0. 04 - 49. 02 - 1. 07- 0. 03 - 96. 4827774. 9142. 902687- 0. 45- 0. 02- 47. 75+ 4. 31- 0. 09 - 49. 01 - 2. 13- 0. 10 - 96. 5432412. 0639. 562675- 0. 71- 0. 09- 47. 81 + 11. 66- 0. 17 - 48. 97 - 4. 82- 0. 23 - 96. 6037248. 9436. 672659- 2. 07- 0. 11- 47. 91 + 14. 46- 0. 24 - 48. 93 - 10. 21- 0. 3。

33、3 - 96. 69图 5 Ballroom 序列 4 种算法率失真曲线示意本文算法的编码效果与全搜索算法相比, 以牺牲少量的 PSNR 换取了码率的节省. 本文提出的预测初值确定规则考虑了多参考帧的方向, 降低了由不同参考帧方向造成预测结果不准确的可能性, 同时在一定程度上增加了视差估计的比例. 由于 Race1序列包含快速运动的物体, 更易采用视差估计;Rena 序列左右视点间的距离只有 5mm( 其他序列相邻视点间隔 20mm) , 左右视点间具有非常强的相关性, 视差估计比运动估计更有效. 因此, 对于 Race1和 Rena 测试序列, 本文算法能够节省更多码率. 图 6所示为文献。

34、7 算法、本文算法预测矢量与全搜索算法预测矢量相比较的差异统计直方图( Rena 序列, QP = 37) . 其中, 采用文献 7 算法, 81.58% 的宏块预测矢量差异小于 2 个像素; 采用本文算法, 86.67% 的宏块预测矢量差异小于 2 个像素. 由于本文算法能够预测得到准确的运动和视差矢量, 编码运动-视差矢量残差需要的比特数更小, 因此整个编码的比特率降低. 同时, 实验结果证明了即使是对于 Race1 这种运动较为剧烈的序列, 采用本文的搜索策略仍然能够获得较准确的运动和视差矢量, 从而保证了编码效率.1713第 10 期邓智玭, 等: 面向立体视频的视差 -运动同步联立。

35、预测算法图 6 矢量差直方图4 结语本文针对传统立体视频编码方法中运动估计和视差估计相互独立、序列相关性得不到充分利用、编码复杂度高等难题, 提出一种迭代搜索策略, 利用立体-运动约束模型在相邻 2 个立体图像对之间进行运动和视差矢量的多次迭代, 不断修正运动和视差矢量候选值, 最终能够同步预测得到最佳运动和视差矢量. 实验结果证明, 该算法能够在基本不降低编码质量的同时, 节省平均 96.43%的编码时间. 在今后的工作中, 我们将考虑多种宏块模式, 并且设计宏块模式快速选择算法, 来进一步提高算法的鲁棒性.参考文献(References) : 1 Aksay A,Akar G B。

36、.Evaluation of stereo video codingschemes formobile devices CP P Proceedings of3DT VConference on the T rue Vision - Capture, T ransmission andDisplay of 3D Video.Washington D C:IEEE ComputerSociety Press, 2009: 1 -4 2 Jung I L, Chung T , Song K, et al. Efficient stereo videocodingbasedonframeskippi。

37、ngforreal -timemobileapplications J .IEEET ransactionsonConsumerElectronics, 2008, 54( 3) : 1259 -1266 3 Smolic A, Mueller K, Stefanoski N, et al. Coding algorithmsfor 3DT V ) a survey J . IEEE T ransactions on Circuits andSystems for Video T echnology, 2007, 17( 11) : 1606 -1621 4 He Renlong, Jiang。

38、 Gangyi, Fu Randi, et al. A multiviewvideo coding method with adaptive selection of reference framemodes J . Journal of Computer -Aided Design & ComputerGraphics, 2007, 19( 9) : 1132 -1137 ( in Chinese)( 贺人龙, 蒋刚毅, 符冉迪, 等. 基于自适应参考帧模式选择的多视点视频编码方法 J . 计算机辅助设计与图形学学报,2007, 19( 9) : 1132 -1137) 5 LiuYanwe。

39、i,HuangQingming,JiXiangyang,etal.M ulti -viewvideocodingwithspatialrandomaccessfunctionality J .Journalof Computer - Aided Design&Computer Graphics, 2008, 20( 7) : 850 -855 ( in Chinese)( 刘延伟, 黄庆明, 季向阳, 等. 支持空域随机访问的多视点视频编码方法 J . 计算机辅助设计与图形学学报, 2008, 20( 7) : 850 -855) 6 Ding L F, Chien S Y, Chen L G。

40、 . Joint prediction algorithmand architecture for stereo video hybrid coding systems J .IEEETransactionsonCircuitsand Systems forVideoT echnology, 2006, 16( 11) : 1324 -1337 7 Lai P, Ortega A . Predictive fast motionP disparity search formultiviewvideocoding CP PProceedingsofSPIE.Bellingham:Societyo。

41、fPhoto-OpticalInstrumentationEngineers, 2006, 6077: 607709 8 Patras I, Alvertos N, T ziritas G. Joint disparity and motionfield estimation instereoscopic imagesequences CP PProceedings of the 13th International Conference on PatternRecognition.Washington DC:IEEEComputerSocietyPress, 1996, 7270: 359 。

42、9 KimY,LeeJ,ParkC,etal.M PEG-4 compatiblestereoscopic sequence codec for stereo broadcasting J . IEEET ransactions on Consumer Electronics, 2005, 51( 4) : 1227 -1236 10 Yang W,Ngan KN,Cai J.An M PEG-4 -compatiblestereoscopicP multiviewvideocodingscheme J .IEEET ransactions on Circuits and Systems fo。

43、r Video T echnology,2006, 16( 2) : 286 -290 11 Ding L F,Tsung P K,Chen W Y,et al.Fast motionestimation with inter -view motion vector prediction for stereoand multiviewvideocoding CP P ProceedingsofIEEEInternational Conference on Acoustics,Speech and SignalProcessing. Washington D C: IEEE Computer Society Press,2008: 1373 -1376 12 ISOP IEC JT C1P SC29 PWG11 JVT- AA207) 2008 Joint multiviewvideo model ( JMVM) 8. 0 S 13 ISOP IEC JTC1P SC29 PWG11 JVT-U 211 ) 2006 Common testconditions for multiview video coding S1714计算机辅助设计与图形学学报第 22 卷。

计算机多媒体技术视差估计,面向立体视频的视差_运动同步联立预测算法相关推荐

计算机多媒体技术视差估计,立体视频中视差估计研究
摘要: 伴随着计算机技术的快速发展,视频编解码技术得到了很大程度的提高.然而,随着人们对视频信息的渴求,单视点视频信息已经不再能够满足人们的要求.近年来,具有3D视觉功能的立体视频技术及多视点视频技术 ...
B站JavaScript从入门到精通Blue石川老师视频部分代码_运动升级_链式运动_土豆网
<!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8" ...
TPAMI 2022 | 国防科大等高校提出光场解耦机制，在超分辨与视差估计任务上取得优异性能...
来源丨我爱计算机视觉光场相机可以通过记录光线的强度与方向信息将3维场景编码至4维光场图像.近年来,卷积神经网络被广泛应用于各项光场图像处理任务.然而,由于光场的空间信息与角度信息随空变的视差高度耦合 ...
计算机多媒体技术视差估计,立体视觉中视差估计算法研究
摘要: 立体视觉是利用同一场景在不同姿态下获取的两幅影像得到空间场景三维信息,进而重建立体场景的一门学科,视差估计则是立体视觉的基础.本文在双目立体视觉的基础上重点研究讨论了空间域与频率域两类视差估计 ...
计算机多媒体视频,计算机多媒体技术Windows视频工具Mediaplayer.ppt
计算机多媒体技术Windows视频工具Mediaplayer 一.多媒体和多媒体技术的含义媒体在计算机领域中一是指存储信息的实体,如磁盘等:二是指传递信息的载体,如数字.文字.声音.图形.图像等.在 ...
舞蹈里需要用计算机的地方,【舞蹈教学论文】计算机多媒体技术在舞蹈教学中的应用(共2080字)...
1计算机多媒体技术在舞蹈教学中的应用首先,在课堂中可以把声音.光影变化.动画.影片等素材有机的整合在一起,丰富课堂教学的内容,刺激学生学习的兴趣,使学生能够通过多媒体客观感受.感知评价自己的动作,及 ...
3D深度估计，让视频特效更梦幻！
本文转载自机器之心. 选自arXiv 作者:罗璇.Jia-Bin Huang等机器之心编译参与:魔王.张倩还记得那个用论文外观判断论文质量的研究吗?在那份研究中,身为顶会领域主席的作者 Jia- ...
《计算机多媒体技术》课程标准
<计算机多媒体技术>课程标准一.课程概述 <计算机多媒体技术>以计算机领域的各种媒体为研究对象,是一门理论与实践相结合性质很强的课程. 在网络技术迅速发展的今天,网络的信息都 ...
基于MAP-MRF的视差估计
写在最前面的话: 此篇文章作为本人对马尔科夫随机场等概率模型在立体视觉的应用的首篇记录,包含了本人对马尔科夫场理论的浅显理解和最大后验概率估计方法的理解.囿于本人学术水平,此篇文章参考了大量的数学教材 ...

计算机多媒体技术视差估计,面向立体视频的视差_运动同步联立预测算法

计算机多媒体技术视差估计,面向立体视频的视差_运动同步联立预测算法相关推荐

最新文章

热门文章