资源描述
收稿日期:2007-03-13;修回日期:2007-05-24。作者简介:杨珺(1978-),女,江西上饶人,博士研究生,主要研究方向:图像检索、计算机视觉;王继成(1958-),男,江苏盐城人,研究员,博士生导师,博士,主要研究方向:图像处理、数据挖掘、软件工程;刘然(1978-),男,湖南邵阳人,博士研究生,主要研究方向:计算机视觉。文章编号:1001-9081(2007)09-2106-04立体图像对的生成杨珺1,王继成1,刘然2(1.同济大学 计算机科学与技术系,上海 201804;2.重庆大学 计算机学院,重庆 400044)牗 牘摘要:获取同一场景的立体图像对是实现双目立体成像的一个关键问题。提出了一种在三维场景已经建好的情况下生成立体图像对的方法。该方法根据双目立体视觉的原理,利用 3DSMAX中的摄像机对象对场景中的物体进行坐标变换和透视投影变换,分别生成左眼视图和右眼视图。实验结果表明,两个目标摄像机与三维模型的位置关系以及基线长度是影响立体效果的重要因素,改变目标摄像机与三维模型的位置,可以分别生成正视差、负视差的立体图像对,当 AB与 CO的比例参数为0.05时,生成的立体图像对的立体效果较佳。关键词:立体视觉;双目立体成像;立体图像对;3DSMAX中图分类号:TP391.41 文献标志码:AStereo pairs creationYANG Jun1牞WANG Ji-cheng1牞LI U Ran2牗 1.Depart ment ofComputerScience and Technology 牞TongjiUniversity牞Shanghai 201804牞China牷2.School ofComputerScience 牞ChongqingUniversity牞Chongqing 400044牞China牘Abstract 牶Stereo pair acquisition of a scene is the key to binocular stereo imaging.This paper presented a stereo paircreationmethod when 3D modelswere constructed.Using ca mera objects in 3DSMAX牞the method started fro m a coordinatetransfor mation ofobjects in the scene based on principle ofbinocular stereo vision.Then themethod carried out the perspectivetransfor mation to create left i mage and right i mage respectively.The results of the experi ment indicate the position of the twotarget cameras and the 3D model 牞 together w ith the length of the base line is the key factor that affects the stereo effec.tChanging the position of the targetca meras and the 3D modelmay result in positive disparity or negative disparity stereo pairs.When the aspect ratio ofAB to CO equals 0.05牞the stereo effect of the stereo pairs created is better.Keywords 牶stereo vision牷binocular stereo imaging 牷stereo pair 牷3DSMAX0引言能在标准的计算机 CRT 监视器上看到立体图像是一件令人兴奋的事情。它可以给人们带来更加真实直观的视觉效果,提供较好的沉浸感。目前人们较多的使用基于监视器的分时双目立体成像系统来实现立体成像 1,2。这种系统是基于双目立体视觉的基本原理进行工作的。人们通常总是用双眼同时观看物体,由于两只眼睛视轴的间距(瞳距)的存在,左眼和右眼在观看一定距离的物体时,所接收到的视觉图像是不同的。大脑通过眼球的运动、调整,综合了这两幅图像的信息,感知到生理深度暗示,从而产生立体感。这便是双目立体视觉的基本原理。根据这一原理,分时双目立体成像系统将时间划分成小片断,让左眼视图和右眼视图交替迅速的显示在监视器上。当左眼视图显示时,液晶光阀眼镜使右眼的液晶镜片遮断,使得只有左眼才能看到监视器;同理,当右眼视图显示时,液晶光阀眼镜使左眼的液晶镜片遮断,使得只有右眼才能看到监视器,这样便产生了立体感 2。左眼视图和右眼视图一起构成立体图像对 3。因此,只要得到立体图像对,就能通过这种系统看到立体图像。有两类方式获得立体图像对 4:第一类方式是使用立体相机拍摄场景得到立体图像,这类方式获得的立体图像效果好。然而,这类方式需要至少两台以上经过光学特性、机械特性和电子特性严格校准的摄像机,并且这两台摄像机的聚焦系统、变焦系统、几何失真、增益控制、光圈控制、会聚控制和视差控制等都要求非常精确的一致。这样就增加了拍摄立体图像的难度 4。这种方式也不适合计算机游戏、影片特技等场合;第二类方式是通过计算机绘制得到立体图像对。这类方式引起了国内外学者的广泛兴趣。已有学者讨论了场景的三维模型已建好的情况下立体图像对的生成 5-9,18。但是较少有文献深入讨论这个问题。本文给出了一种在已建好三维模型的情况下生成立体图像对的方法,并指出在何种情形下成像能够达到较好的立体效果(立体感逼真程度)。1坐标转换在立体图像对的生成过程中,经常遇到坐标转换的问题。我们给出了一个基于监视器的双目立体成像模型。该模型如图 1所示。所标参数的具体含义参见文献 2。针对该模型可以求出从景物坐标系 10,11到世界坐标系的坐标变换矩阵。第 27卷第 9期2007年 9月计算机应用ComputerApplicationsVo.l 27 No.9Sep.20071.1从景物坐标系到世界坐标系设景物坐标系原点 d在世界坐标系中的坐标为(dx,dy,dz),且两坐标系的单位长度相同。若已知坐标轴间的欧拉角分别为 x(俯仰角,pitch)、y(偏航角,yaw)和 z(滚动角,roll),则根据布尔莎公式,景物坐标系中任意一点(xj,yj,zj)在世界坐标系中的坐标为 10:x y z 1=xjyjzj1 T(1)其中:T为变换矩阵。T=cosycoszsinxsin ycosz-cosxsin zcosxsin ycosz-sin xcosz0cosysinzsinxsin ysin z+cosxcoszcosxsin ysinz-sinxcosz0sin zsinxcosycosxcosy0dxdydz1若已知 Z 轴和 X轴、Y 轴、Z 轴的夹角分别为 、和 ,则 T 为 12:coscos(cos2+cos2)1/2cos cos(cos2+cos2)1/2-(cos2+cos2)1/20-cos(cos2+cos2)1/2cos(cos2+cos2)1/200coscoscos0dxdydz1 若已知景物坐标系三个基本单位向量在世界坐标系中的坐标分别为(xu,yu,zu)、(xv,yv,zv)和(xw,yw,zw),则 T为 13:xuyuzu0 xvyvzv0 xwywzw0dxdydz11.2 从世界坐标系到图像坐标系如图 1所示,从世界坐标系到计算机屏幕的图像坐标系(又叫设备坐标系)的公式为 2:I1(xw-h)pdod+h-x0,ywpdod-y0I2(xw+h)pdod-h-x0,ywpdod-y0(2)其中:MO N 和 XYZ 两坐标系的单位长度相同。图 1双目立体成像模型在 实验 中,将 监视 器 的显 示区 域 调整 为 28.2 c m 21.2 c m,分辨率调整为 800 600,因而有 1 c m=28.35pixels。设 O 在坐标系 XYZ 中的坐标为(-14.11,-10.58,pd),即 x0=-14.11 c m,y0=-10.58 c m,如图 2所示,则式(2)可改写为:I1(xw-h)pdod+h+14.1128.35,ywpdod+10.5828.35I2(xw+h)pdod-h+14.1128.35,ywpdod+10.5828.35(3)其中,坐标的单位为像素。图 2世界坐标系与图像坐标系根据上述讨论,可以采用如下方法在计算机监视器上生成立体图像对:首先在特定的景物坐标系中绘制场景,然后根据式(1)、(3)将该场景分别投影成图像坐标系中的左眼视图和右眼视图。通过基于监视器的分时双目立体成像系统便可以观察到立体图像。23DSMAX中摄像机的使用在三维场景已经建好的情况下,需要根据式(1)、(3)将该场景分别投影成图像坐标系中的左眼视图和右眼视图以得到立体图像对。有些绘图软件(例如3DSMAX)提供了摄像机对象,它能够简化这种投影过程。就像人的眼睛观察场景中的物体一样,摄像机记录图像的工作原理是:先对场景中的物体进行坐标变换,然后再进行透视投影。物体经过摄像机的投影就是拍摄到的底片,而监视器上摄像机视口的图像则是底片冲洗出来的照片。如果把两个完全相同的摄像机对象分别放置在不同位置,使它们2107第 9期杨珺等:立体图像对的生成之间的距离等于瞳距,再对同一场景进行拍照,就能生成立体图像对。下面介绍如何利用摄像机对象生成立体图像对。2.1度量单位在 3DSMAX中,默认情况下,数值使用的度量单位是通用单位,它表示在 3DSMAX的工作区域中实际显示的单位。使用者可以定义每个通用单位代表任何实际单位。例如,每个通用单位可以代表 1 in、5m、或者 100 n m ile等。在 3DSMAX中进行正确的单位设置十分重要。因为 3DS MAX 中高级光照特性使用真实世界的尺寸进行计算,它要求建立的模型与真实世界的尺寸一致。2.2摄像机对象在 3DSMAX中可以生成摄像机对象(目标摄像机和自由摄像机)。它们的作用与真实世界的摄像机一样,用于记录静态或动态的图像。生成静态的立体图像对主要用到目标摄像机对象,它包含了视点、目标点。目标点是一个非渲染对象,它用来确定摄像机的观察方向,摄像机的视点总是盯着目标点。视点到目标点的连线称为视线。摄像机在创建后就被指定了默认的参数。这些参数包括:Lens(镜头)和 FOV(视野):镜头和视野是相关的,改变镜头的长度自然也会改变摄像机的视野。真正的摄像机,其镜头长度和视野是被约束在一起的,但是不同的摄像机镜头配置有不同的视野和镜头长度比。影响视野的另外一个因素是图像的纵横比,一般用 X轴方向的数值比 Y 轴方向的数值来表示。例如,如果镜头长度是 20mm,图像纵横比是 2.35,那么视野将是 94;如果镜头长度是 20mm,图像纵横比是1.33,那么视野将是 62。人眼所能聚焦的角度是 48,因此为了符合人们的习惯,摄像机镜头一般使用 48mm左右 6。目标距离:目标距离是摄像机到目标点的距离,可以通过改变这个距离来使目标点在视线(视点到目标点的连线)方向上靠近或者远离摄像机。当使用景深时,这个距离非常有用。图 3目标摄像机3立体图像对的立体效果两个目标摄像机与三维模型的位置关系以及两个目标摄像机之间的距离(这里等于基线 14,15的长度),是影响立体效果的重要因素,下面就定性地讨论这些因素。3.1目标摄像机与三维模型的位置关系在 3DSMAX中利用两个目标摄像机生成立体图像对时,这两个摄像机的镜头、视野和目标距离都要相同,它们的视点和目标点必须都在同一平面内。这样可以避免产生垂直视差 16。根据目标摄像机与三维模型的位置关系,视差可分为正视差、负视差和正负视差同时存在三种情形。当两个目标摄像机的两条视线相互平行或相交于目标点,且三维模型在目标点的内侧时(如图 4所示),生成负视差的立体图像对。此时人眼感觉物体在监视器之前。当两个目标摄像机的两条视线相交于目标点,且三维模型在目标点的外侧时(如图 5所示),生成正视差的立体图像对。此时人眼感觉物体在监视器里面。当两个目标摄像机的两条视线相交于目标点,且目标点内外侧都存在三维模型时(如图 6所示),生成的立体图像对同时存在正负视差。此时人眼感觉物体镶嵌在监视器的表面。通过实验验证,上述三种情形的确是存在的。图 4负视差的情形图 5正视差的情形图 6正负视差同时存在的情形3.2基线长度基线长度(两个目标摄像机之间的距离)是影响立体效果的另一个重要因素。这是因为两个目标摄像机代表了双眼,而它们之间的距离就相当于瞳距。瞳距过大会使人眼聚焦困难从而降低甚至丧失立体效果,只有在一定的范围内才能使人产生视觉舒适的立体图像 5。因此需要仔细调整基线长度。最佳基线长度与输出图像的监视器大小有关,也与人眼到监视器之间的距离有关。也就是说,生成的立体图像对的立体效果,与它们在显示设备上的偏差和观察距离有关。对于某一特定的立体图像对,在观察距离一定的情况下,在 15监视器上观看到的立体效果极佳,而在 19 监视器上可能会丧失立体效果;同样,在给定监视器的情况下,在 1m的距离观看可得到极佳的立体效果,而在 5m的距离观看时也可能丧失立体效果。而所成虚像的物理位置,可以根据式(1)、(2)计算得到。此外,在目标摄像机的目标点重合的情况下,最佳基线长度也与目标点到基线的距离和摄像机本身的镜头长度有关。如图 7所示,摄像机和目标点围成 ABC,CO为基线 AB上的高,则 AB 的最佳长度与 CO的长度和摄像机本身的镜头长度都有关系。由此可见,基线长度与立体效果的关系较为复杂。在特定的监视器和观察距离的情况下,保证两个摄像机的镜头长2108计算机应用2007年度不发生变化,采用多次渲染、多次试验的方法是确定摄像机最佳基线长度的一个可行方法。本文采用这种方法讨论了在表 1所示参数的情况下,基线长度的最佳值。表 1实验中保持定值的参数实验步骤如下:1)在模型的场景中加入两个目标摄像机,两个目标点的坐标均为(0,0,120),两个视点的坐标分别为(5,-1000,400)、(-5,-1000,400);2)渲染两个摄像机拍到的模型的图像,得到此时的立体图像对;3)保持目标点固定不变,保持两个摄像机视点的 Y 轴坐标为-1000、Z轴坐标为 400不变,改变 X轴坐标,使两个摄像机向相反的方向对称地远离(如图 7所示),从而增加基线长度;图 7实验过程4)重复第 2、3步,渲染得到基线长度为 10、20、30、90、100、150、200、250、300时的模型立体图像对;5)使用分时双目立体成像系统观看得到的立体图像对,根据 3DSMAX中模型的实际比例,寻找出立体效果最逼真的立体图像对,记录下其渲染时的基线长度,便是此时的最佳基线长度。通过多人多次实验,可得出结论:当采用表 1的参数时,最佳基线长度为 50左右(单位为通用单位)。此时 AB/CO=0.05。4结语目前较少有文献对立体效果进行定量的评价,多数评价是定性的 2,17。在确定最佳基线长度的实验中,我们也采用了人眼观察的定性评价方法。实验发现,随着基线长度从 10开始增加,观看到的模型在水平方向上的不会产生明显的形变,而在垂直方向上的大小会随之增大。当观看到的模型在水平和垂直方向上的大小比例与实际模型的比例近似相同时,可认为此时的基线长度为最佳基线长度。实验确定的最佳基线长度为 50,这个结果会因观察者的不同而略有区别。在上述实 验中,当基 线长 度 达到 最佳 基线 长 度时,AB/CO=0.05;保持这一比例不变,让 AB和 CO同时增大,再重复渲染模型进行实验,可以发现立体效果不会发生明显变化,即立体感逼真程度不会发生明显变化。本文研究了静态立体图像对的生成,详细讨论了它的立体效果;对于动态立体视频的生成及其立体效果的评价,还需要进一步研究。参考文献:犤 1犦 刘洋牞 郑小林牞 李冰.内窥镜立体视觉的实现犤J 犦.北京生物医学工程牞 2003 牞 22 牗 3牘 牶187-190.犤 2犦 ZHU Q S牞LI U R牞XU X Y.P r operties of a binocular stereo visionmodel 犤 C犦/11th Joint International ComputerConference.犤 S.l 犦 牶World Scientific Publishing 牞2005牶831-834.犤 3犦 周丽萍.虚拟现实中立体视觉的研究犤 J 犦.计算机应用牞 1999牞 19牗 4 牘 牶24-26.犤 4犦 侯春萍牞 俞斯乐.一种平面图像立体化的新方法犤 J犦.电子学报牞2002 牞 30 牗 12牘 牶1861-1864.犤 5犦 黄心渊.虚拟现实技术与应用犤 M犦.北京牶 科学出版社牞1999牶152-160.犤 6犦 黄心渊牞 李畅.体视动态模拟中的图像生成与合成犤 J 犦.计算机仿真牞1999牞16 牗 3 牘 牶26-28.犤 7犦 黄心渊牞 唐良瑞.生成体视动画的一种新方法犤 J 犦.计算机辅助设计与图形学学报牞 1999牞11 牗 5 牘 牶409-411.犤 8犦 黄心渊牞 陈世红.3DS MAX 中体视动画生成模块的实现犤 J 犦.计算机工程牞 2002 牞 28牗 4牘 牶 178-179牞257.犤 9犦 FORSYTH D A牞PONCE J.Computer v ision牶a modern approach犤 M犦.New Jersey牶 Pearson Education牞2003.犤 10犦 胡培民牞 陈慧标.三维曲线的计算机双色立体显示技术犤 J 犦.计算机工程与应用牞 1999牞 25牗 6 牘 牶 30-32.犤 11犦 张瑞合.基于计算机视觉的空间目标定位系统研究犤 D犦.南京牶南京农业大学牞 2000.犤 12犦 许社教.基于方向余弦参量的物坐标系与世界坐标系间的坐标变换犤J 犦.工程图学学报牞 2004 牞 25 牗 1 牘 牶 123-127.犤 13犦 许社教.三维图形系统中两种坐标系之间的坐标变换犤 J 犦.西安电子科技大学学报牞 1996牞 23牗 3 牘 牶 429-432.犤 14犦 安平牞 张兆扬.基于立体摄像几何特性的视差快速匹配算法犤 J 犦.上海大学学报牶 自然科学版牞 2002牞 6牗 5 牘 牶 399-402.犤 15犦 章毓晋.图像理解与计算机视觉犤 M犦.北京牶 清华大学出版社牞2000.犤 16犦 顾郁莲牞 蔡宣平.计算机立体视图绘制技术犤 J 犦.国防科技参考牞1998 牞 19牗 1牘 牶 63-70犤 17犦 KOO IF L牞TOET A.Visual com fort of binocularand 3D犤 J 犦.D is-plays 牞2004牗 25牘 牶 99-108.犤 18犦 李畅牞 左正兴牞 黄心渊.实用虚拟现实中体视动画的实现犤 J犦.计算机仿真牞 2002 牞 19牗 6牘 牶 84-86 牞 83.2109第 9期杨珺等:立体图像对的生成
展开阅读全文