资源描述
基于MATLAB的数字图像处理的彩色图像处理【实用文档】doc
文档可直接使用可编辑,欢迎下载
南京信息工程大学滨江学院
专业: 电子信工程
学生姓名: 戴锦栋
指导教师: 王心蕾
完成时间:2024年9月24日
基于MATLAB的数字图像处理的彩色图像处理
摘要
自20世纪70年代以来,由于数字技术和计算机技术的迅猛发展,给数字图像处理(Digital Image Processing)提供了先进的技术手段。图像科学从信息处理、自动控制系统理论、计算机科学、数据通信等学科中脱颖而出,成为研究图像信息的获取、传输、存储、变换、显示、理解和综合利用的新兴学科。数字图像处理在实际中得到了广泛应用.特别是在遥感、航空航天、通信、生物和医学、安全监控、工业生产、视频和多媒体、机器人视觉、物理和化学分析、公安和军事等领域.它在国家安全、经济发展和日常生活中已经起到越来越重要的作用。
由于彩色图像提供了比灰度图像更为丰富的信息,因此彩色图像处理正受到人们越来越多的关注。
关键字
颜色空间 彩色图像分割 彩色空间转换 彩色变换
目录
引言……………………………………………………………………11MATLAB图像处理工具箱及数字图像处理基本过程简介…………2 1。1 常用图像操作…………………………………………………… 2
1。2 图像增强功能…………………………………………………… 2
1。3边缘检测和图像分割功能……………………………………… 3
1,4图像变换功能…………………………………………………… 4
2 MATLAB中彩色图像表示……………………………………………4
2。1RGB图像……………………………………………………………4
2.2索引图像……………………………………………………………6
2。3处理RGB和索引图像………………………………………………6
3 彩色图像处理…………………………………………………………6
3.1读入一幅RGB图像,将其分别转换到CMY空间、HSI空间并显示………6
3.2彩色空间滤波………………………………………………………8
参考文献………………………………………………………………9
致谢………………………………………………………………………9
引言
MATLAB 语言是由美国MathWorks 公司推出的计算机软件,经过多年的逐步发展与不断完善,现已成为国际公认的最优秀的科学计算与数学应用软件之一, 是近几年来在国内外广泛流行的一种可视化科学计算软件。它集数值分析、矩阵运算、信号处理和图形显示于一体,构成了一个方便的、界面友好的用户环境,而且还具有可扩展性特征.MathWorks 公司针对不同领域的应用,推出了信号处理、控制系统、神经网络、图像处理、小波分析、鲁棒控制、非线性系统控制设计、系统辨识、优化设计、统计分析、财政金融、样条、通信等30 多个具有专门功能的工具箱,这些工具箱是由该领域内的学术水平较高的专家编写的,无需用户自己编写所用的专业基础程序, 可直接对工具箱进行运用。同时,工具箱内的函数源程序也是开放性的,多为M 文件,用户可以查看这些文件的代码并进行更改,MALAB 支持用户对其函数进行二次开发, 用户的应用程序也可以作为新的函数添加到相应的工具箱中。MATLAB 中的数字图像是以矩阵形式表示的,这意味着MATLAB 强大的矩阵运算能力用于图像处理非常有利,矩阵运算的语法对MATLAB 中的数字图像同样适用。本文对MATLAB 图像处理工具箱进行探索及应用,实验证明该软件功能强大,语言简洁易学,人机界面友好,工具箱具有丰富的技
术支持并集成了该领域专家的智慧,应用简单而效果良好.
.1.
1 MATLAB 图像处理工具箱及数字图像处理基本过程简介
数字图像处理工具箱函数包括以下15 类:⑴、图像显示函数;⑵、图像文件输入、输出函数;⑶、图像几何操作函数;⑷、图像像素值及统计函数;⑸、图像分析函数;⑹、图像增强函数;⑺、线性滤波函数;⑻、二维线性滤波器设计函数;⑼、图像变换函数;⑽、图像邻域及块操作函数;⑾、二值图像操作函数;⑿、基于区域的图像处理函数;⒀、颜色图操作函数;⒁、颜色空间转换函数;⒂、图像类型和类型转换函数.
MATLAB 图像处理工具箱支持四种图像类型, 分别为真彩色图像、索引色图像、灰度图像、二值图像,由于有的函数对图像类型有限制, 这四种类型可以用工具箱的类型转换函数相互转换。MATLAB 可操作的图像文件包括JPG、HDF、JPEG、PCX、TIFF、XWD 等格式.下面就图像处理的基本过程讨论工具箱所实现的常用功能。
1.1。 常用图像操作
图像的读写与显示操作:用imread( )读取图像,imwrite( )输出图像,把图像显示于屏幕有imshow( ),image( )等函数.imcrop()对图像进行裁剪,图像的插值缩放可用imresize( )函数实现,旋转用imrotate( )实现。
1.2. 图像增强功能:
图像增强是数字图像处理过程中常用的一种方法, 目的是采用一系列技术去改善图像的视觉效果或将图像转换成一种更适合于人眼观察和机器自动分析的形式。常用的图像增强方法有以下几种:
1)灰度直方图均衡化
均匀量化的自然图像的灰度直方图通常在低灰度区间上频率较大, 使得图像中较暗区域中的细节看不清楚, 采用直方图修整可使原图像灰度集中的区域
.2.
拉开或使灰度分布均匀,从而增大反差,使图像的细节清晰,达到增强目的。直方图均衡化可用histeq( )函数实现。
2)灰度变换法
照片或电子方法得到的图像,常表现出低对比度即整个图像偏亮或偏暗, 为此需要对图像中的每一像素的灰度级进行标度变换,扩大图像灰度范围,以达到改善图像质量的目的。这一灰度调整过程可用imadjust( )函数实现.
3)平滑与锐化滤波
平滑技术用于平滑图像中的噪声,基本采用在空间域上的求平均值或中值.或在频域上采取低通滤波,因在灰度连续变化的图像中, 我们通常认为与相邻像素灰度相差很大的突变点为噪声点,灰度突变代表了一种高频分量,低通滤波则可以削弱图像的高频成分,平滑了图像信号,但也可能使图像目标区域的边界变得模糊.而锐化技术采用的是频域上的高通滤波方法,通过增强高频成分减少图像中的模糊,特别是模糊的边缘部分得到了增强, 但同时也放大了图像的噪声。在MATLAB 中,各种滤波方法都是在空间域中通过不同的卷积模板即滤波算子实现,可用fspecial( )函数创建预定义的滤波算子,然后用filter2( )或conv2( )函数在实现卷积运算的基础上进行滤波。
1。3. 边缘检测和图像分割功能
边缘检测是一种重要的区域处理方法, 边缘是所要提取目标和背景的分界线,提取出边缘才能将目标和背景区分开来.如果一个像素落在边界上, 那么它的邻域将成为一个灰度级变化的带。对这种变化最有用的两个特征是灰度的变化率和方向。边缘检测算子可以检查每个像素的邻域并对灰度变化率进行量化,也包括对方向的确定,其中大多数是基于方向导数掩模求卷积的方法。MATLAB 工具箱提供的edge( )函数可针对sobel算子、prewitt 算子、Roberts 算子、log 算子和canny 算子实现检测边缘的功能。基于灰度的图像分割方法也可以用简单的MATLAB 代码实现.
。3。
1。4。 图像变换功能
图像变换技术是图像处理的重要工具,常运用于图像压缩、滤波、编码和后续的特征抽取或信息分析过程.MATLAB 工具箱提供了常用的变换函数,如fft2( )与ifft2( )函数分别实现二维快速傅立叶变换与其逆变换,dct2( )与idct2( )函数实现二维离散余弦变换与其逆变换, Radon( ),iradon( )函数实现Radon变换与逆Radon 变换。除了以上基本的图像处理功能,MATLAB 还提供了如二值图像的膨胀运算dilate( )函数、腐蚀运算erode( )函数等基于数学形态学与二值图像的操作函数.
2.MATLAB种彩色图像的表示
2。1RGB图像
rgb_image = cat(3, fR, fG, fB)
fR = rgb_image(:, :, 1);
fG = rgb_image(:, :, 2);
fB = rgb_image(:, :, 3);
%% 生成RGB立方体
clc
clear
rgbcube(-10,-10,4);%3个参数表示观看图像视角的点坐标
axis on; %坐标轴范围 g
rid on; %画图时添加网格线
.4。
title('RGB立方体1');
figure,rgbcube(10,10,4);%10,10,4是默认的坐标
axis on;grid on;
title('RGB立方体2');
实验结果:
.5。
2。2索引图像
索引图像有两个分量,即整数的数据矩阵X和彩色映射矩阵map.
2。3处理RGB和索引图像的函数
rgb_image表示RGB图像,gray_image表示灰度图像,bw表示黑白图像,X表示索引图像的数据矩阵分量.
函数: dither:采用“抖动”从RGB图像创建索引图像
grayslice: 从灰度级亮度图像通过多级阈值创建索引图像
gray2ind: 从灰度级亮度图像创建索引图像
ind2gray: 从索引图像创建灰度级亮度图像
rgb2ind: 从RGB图像创建索引图像
ind2rgb: 从索引图像创建RGB图像
rgb2gray: 从RGB图像创建灰度级图像
3彩色图像处理
3。1读入一幅RGB图像,将其分别转换到CMY空间、HSI空间并显示。
.6.
转换到CMY空间
rgb_I=imread('peppers。png');
cmy_I=imcomplement(rgb_I);
imshow(rgb_I); figure;
imshow(cmy_I);
figure;
imshow(h);
figure;
imshow(s);
figure;
imshow(I);
HSI空间
rgb=imread('peppers。png');
imshow(rgb);
rgb=im2double(rgb);
r=rgb(:,:,1);
g=rgb(:,:,2);
b=rgb(:,:,3);
I=(r+g+b)/3;
tmp1=min(min(r,g),b);
tmp2=r+g+b; tmp2(tmp2==0)=eps;
s=1-3.*tmp1./tmp2; tmp1=0。5*((r-g)+(r-b));
tmp1=sqrt((r-g).^2+(r—b).*(g—b));
theta=acos(tmp1./(tmp2+eps));
h=theta; h(b>g)=2*pi—h(b>g);
h=h/(2*pi);
h(s==0)=0; hsi=cat(3,h,s,I);
.7.
m=fspecial('average');
r_filtered=imfilter(r,m);
g_filtered=imfilter(g,m);
b_filtered=imfilter(b,m);
rgb_filtered=cat(3,r_filtered,g_filtered,b_filtered);
figure;
imshow(rgb_filtered);
lapMatrix=[1 1 1;1 -8 1;1 1 1];
i_tmp=imfilter(rgb,lapMatrix,'replicate');
i_sharped=imsubtract(rgb,i_tmp);
figure;
imshow(i_sharped);
3,2彩色图像的空间滤波
rgb=imread('peppers。png');
figure;
imshow(rgb);
r=rgb(:,:,1); %平滑滤波
g=rgb(:,:,2);
b=rgb(:,:,3);
figure;
imshow(r);
figure; imshow(g);
figure;
imshow(b);
.8.
参考文献
[1]王新成.高级图像处理技术[M] .北京:中国科学技术出版社.2001,18-90;
[2] Kenneth.R.Castleman.数字图像处理技术[M].北京:电子工业出版社.1998,14—16;
[4]冈萨雷斯 伍兹 数字图像处理(MATLAB版)(第二版)2013;
致谢
感谢王老师的辛勤指导
.9.
随机过程在网络安全和图像处理中的应用
一、随机过程概述
“随机过程理论与方法”是一连串随机事件动态关系定量描述的学科,同时也是自然科学、工程科学及社会科学各领域研究随机现象的重要工具,在理工科院校研究生教学中均属于量大面广的公共基础课,是研究生学好专业课程,深入从事科学研究必不可少的有力工具。
随机过程有一族无限多个随机变量组成的序列,是用来描绘一连串随机事件动态关系的序列.随机过程论与其他数学分支如位势论、微分方程、力学及复变函数论等有密切的联系,是在自然科学、工程科学及社会科学各领域研究随机现象的重要工具。随机过程论目前已得到广泛的应用,在诸如天气预报、统计物理、天体物理、运筹决策、经济数学、安全科学、人口理论、可靠性及计算机科学等很多领域都要经常用到随机过程的理论来建立数学模型.在客观世界中有些随机现象表示的是是事物随机变化的过程,不能用随机变量和速记矢量来描绘,需要用一族无限多个随机变量/矢量来描绘,这就是随机过程。
二、随机过程的发展历史
1900年,Bachelier首次将布朗运动用于股票价格的描述。
随后公式化概率论首先使得随机过程的研究获得了新的起点,是现代概率论研究的主要论题。1907年前后,Α.Α。马尔可夫研究过一列有特定相依性的随机变量,后人称之为马尔可夫链(见马尔可夫过程)。这是一种无后效性随机过程,即在已知当前状态下,过程未来状态与其过去状态无关。
1923年N。维纳给出了布朗运动的数学定义(后人也称数学上的布朗运动为维纳过程),这种过程至今仍是重要的研究对象。维纳在时间序列的预测和滤波理论的建立做出了贡献。
1931年,Α。Η.柯尔莫哥洛夫发表了《概率论的解析方法》;三年后,Α。Я.辛钦发表了《平稳过程的相关理论》。这两篇重要论文为马尔可夫过程与平稳过程奠定了理论基础.
随后,P。 Levy从1938年开始创立研究随机过程的新方法,即着眼于轨道性质的概率方法,1948年出版了《随机过程与布朗运动》,提出了独立增量的一般理论,并以其为基础极大地促进了对作为一类特殊的Markov过程的布朗运动的研究。
1934年辛钦提出了平稳过程的相关理论。
从1942年开始,日本数学家伊藤清引进了随机积分和随机微分方程。1951年,伊藤清建立了关于布朗运动的随机微分方程的理论(见随机积分),为研究马尔可夫过程开辟了新的道路.
1953年,J.L。杜布的名著《随机过程论》问世,它系统且严格地叙述了随机过程的基本理论。
60年代,法国学派基于马尔可夫过程和位势理论中的一些思想与结果,在相当大的程度上发展了随机过程的一般理论,包括截口定理与过程的投影理论等。
随机过程的发展历史当中,中国学者在平稳过程、马尔可夫过程、鞅论、极限定理、随机微分方程等方面也做出了较好的工作。在随机过程里面的贡献者主要有许宝禄、江泽培、王梓坤、侯振庭,陈木法、严加安、马志明、杨向群等人.国外中国人在随机过程方面的主要贡献者有钟开莱、李文博等人。
研究随机过程的方法多种多样,主要可以分为两大类:一类是概率方法,其中用到轨道性质、停时和随机微分方程等;另一类是分析的方法,其中用到测度论、微分方程、半群理论、函数堆和希尔伯特空间等。实际研究中常常两种方法并用。另外组合方法和代数方法在某些特殊随机过程的研究中也有一定作用.研究的主要内容有:多指标随机过程、无穷质点与马尔可夫过程、概率与位势及各种特殊过程的专题讨论等。
三、随机过程在网络安全和图像处理中的应用
随机过程论的强大生命力来源于理论本身的内部,来源于其他数学分支如位势论、微分方程、力学、复变函数论等与随机过程论的相互渗透和彼此促进,而更重要的是来源于生产活动、科学研究和工程技术中的大量实际问题所提出的要求。目前随机过程论已得到广泛的应用,本文主要介绍随着过程在网络安全和图像处理中的应用。
(一)随机过程在网络安全中的应用
随着计算机网络的普及与应用,人们越来越重视网络的安全问题。信息安全状况对于我国来说也不是很乐观,另外网民信息安全危害意识也非常淡薄。由于网民对信息安全事件的危害并不了解或不在意,在遇到信息安全事件的时候,有高达47。5%的网民不做任何处理。由于互联网的开放性以及存在系统安全脆弱性, 黑客们以及一些不法分子常常利用网络协议、操作系统以及应用软件的一些漏洞入侵网络上的主机, 对用户的财产造成损失以及个人资料的泄露。近年来, 网络的安全受到了极大的威胁,大规模病毒攻击不断的爆发,系统漏洞的出现的速度越来越快。
为了发现那些破坏网络完整性的异常活动,于是提出了一种对网络活动进行检测的方法.20 世纪 90 年代, 支持向量机(Support Vector Machien,简称 SVM)的发展基于统计学习理论基础,适用于小样本问题的一种性能较好的机器学习方法。SVM 本质上是一个凸最优化问题。因此可以将 SVM 应用于入侵检测问题当中.支持向量机的理论基础就是 VC 维和结构风险最小化。通常情况下,SVM通过使用核函数,这样就可以把特征向量空间从低维映射到高维,从而实现了从线性分类器到非线性分类器的转变,这样的好处是同时也降低了计算复杂度。
在入侵检测中,获取完备的训练样本集是非常困难的、数据的非线性分类、数据的维数较高等特点,支持向量机是一种优良的机器学习方法,并且有着完备的理论基础,支持向量在解决小样本和非线性模式识别问题中有着突出的表现,同时它能够避免“维数灾难”和“过拟合”的问题出现,在机器学习方面支持向量机得到了广泛的应用,因而在入侵检测中应用支持向量机将得到的好的检测效果。
随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户合作参与”的开放式架构理念。与之相应地,互联网用户则由单纯的“读”网页而开始向“写”网页和“网络联合共建”发展,另一方面也由被动地接收互联网信息向信息的主动创造方面做出了推进和转变。在网络中,由于个人身份的匿名化,网民敢于表达与自身利益息息相关或自己所关心的各种公共事务(如决策公信、社会热点、突发事件等) 的真实观点。这种个人观点可以依靠网络进行传播,引起效应共鸣,形成网络舆情。
基于马尔科夫逻辑网,有学者设计了一个网络舆情引导的框架。总体框架分别为信息预处理模块,词语情感分析模块,谓词、子句设计模块,马尔科夫逻辑网结构学习模块,马尔科夫逻辑网推理模块以及实验结果推理验证模块.预处理的功能完成实现后,就可以得到结构学习所需的谓词文件和数据文件。基于此,则可通过马尔科夫逻辑网的结构学习,学习获得相应的模型。学习得到的马尔科夫逻辑网络里,包含系统设计谓词的权重,以及自建子句和系统自身学习所得子句的权重。通过设计适当的谓词,可以得到本系统需要的舆情调控方式,文本感情色彩等值的权重,这些则将用于指导显示环境中的舆情调控。
(二)随机过程在图像处理中的应用
纹理作为物体表面的固有属性,与物体表面的光学属性及微观几何特征紧密相关。基于图像的纹理特征对其进行分割,对虚拟现实领域中的目标检测、目标识别、场景仿真、人机交互等研究具有重要的意义。
马尔科夫随机场( Markov random field, MRF) 理论提供了方便且具有一致性的建模方法来描述图像相邻像素间的上下文约束关系,因而被广泛应用于图像分割方法中[ 8- 11]。进行 MRF 图像分割要解决的首要问题是提取某种( 或某些) 表征纹理属性的特征值建立 MRF 特征场模型。由于基于图像灰度信息的 MRF 模型仅仅考虑像素点与其邻域像素的上下文关系,因此缺乏对图像整体纹理信息的描述。现有研究表明,从图像灰度共生矩阵( gray-level co-occurrence matrix, GLCM) 中提取出一系列统计量作为构建 MRF 特征场模型的特征值,可以反映纹理图像在空间上的分布特性,描述纹理结构性质特征[ 12- 17].但是基于灰度共生矩阵提取纹理特征值容易弱化对图像纹理细节和边缘轮廓信息的描述,不能全面反映图像纹理的区域特征,进而影响分割的精确性。
为了克服这一问题,有学者提出了一种改进的图像分割方法.将分数阶微分运算引入图像纹理特征提取过程,利用它对图像细节信息的敏感性提取图像纹理细节和边缘轮廓信息,与灰度共生矩阵提取的纹理空间分布特性相结合,强化对纹理细节和边缘轮廓的描述,得到完备的图像纹理信息,以弥补传统算法对图像纹理信息描述不足的缺陷。此外,为准确划分图像中不同的纹理区域,在分割后处理过程中利用模糊熵准则对分割结果进行进一步优化,以降低噪声干扰,减少区域内错分点。
基于图论,不论是基于边缘信息的图像分割还是基于区域信息的图像分割都需要将图像映射成图或网络图,并对图或网络图进行表示。网络图的结点对应图像的像素。网络图的边对应图像中像素的相邻性。网络图的权值对应于图像中相邻像素的关联程度。在基于边缘信息的图像分割中,网络图的权值反映的是图像中相邻两个像素间的边缘性,大的权值,表示像素间具有强的边缘连接,小的权值,表示像素间具有弱的边缘连接。在基于区域信息的图像分割中,网络图的权值反映的是图像中相邻两个像素间的相似性,大的权值,表示像素间具有强的相似性,小的权值,表示像素间具有弱的相似性。对于网络图的矩阵表示,本文采用图的邻接矩阵,它可以很好地表示图或网络图中结点与结点之间的邻接关系,反映在图像中,正好可以反映图像像素间的邻接关系。并且通过对邻接矩阵的运算与操作,完成对图像的相应处理。
基于边缘信息的图像分割对应图论的两个主要特性是生成树和最短路径。在加权无向图中,生成树的代价是该生成树的所有边的权的和,生成树可表达图像中图像区域的边界信息。对于树,每个元素只有一个前趋,但有多个后续,具体需要怎样的生成树或图像的边界,需要按照一定的准则来判断与搜索。网络图中的最短路径是指从某个结点出发到其它任意一个结点的最短路径。在一定的代价函数设置下,最短路径可对应于图像中目标区域的边界。也就是通过一定的搜索,形成的指定点间的最短路径树就对应着图像的目标轮廓.
基于区域信息的图像分割对应图论的主要特性是:割、最小割及度。割就是将图或网络图分为若干子图。以两个子图为例,就是将图划分为两个互补的子图,连接这两个子图的边的权值之和称为割。反映在图像中,对网络图的切割对应的就是将图像分割成两个区域部分,割表示的就是两个区域部分之间的关联程度或相似性。最小割表示两个区域间具有最小的相似性。图中结点的度是指与其相关联边的数目,网络图中某个结点的度定义为连接它的所有边的权值之和。结点的度反映了结点与其它结点联系的程度,结点的度越大,说明它与其它结点的联系越紧密,结点的度越小说明它与其它结点的联系程度越小,当结点的度为零时,该结点为孤立点。反映在图像中,结点的度反映了对应像素与其它像素或区域的联系程度.
数字图像合成技术的发展和应用
来源:依马狮网 李海燕 周一楠 中国传媒大学信息工程学院科学艺术系
图像合成,属图像处理的范畴,主要指把两个或两个以上的视频或图像信号通过加工处理,叠加或组合在一起,创作出新的图像效果;对原始素材的深度加工处理,使之产生新的艺术效果。若将传统的影视制作比作以时间为轴的叙述,图像合成则是于同一时刻在空间的领域进行创作,在二维的电视画面中表现出空间的层次感,增强电视画面的表现力,使电视画面所传递的信息越来越丰富,形成了一套独特的创作手法。合成技术逐渐成为影视节目后期制作环节中一种越来越重要的一环。
随着数字技术、计算机技术的迅猛发展,近几年内图像合成技术在不断优化的同时也发生了质的飞跃。从能够完成混和、键控等合成功能的模拟切换台,到如今特色各异的合成软件以及功能强大的数字影视后期合成系统,合成的概念正在被逐步完善。数字图像合成技术得以集成在各种不同类型的系统之中,成为了影视节目制作技术数字化发展进程中,继非线性编辑、虚拟演播室技术之后的又一个亮点和焦点。
一 合成技术的实现方式
图像合成技术是在传统键控技术,即抠像技术的基础上发展而来的。抠像技术用键源图像形成的键信号抠去背景图像的一部分,并填入前景图像的相应部分。根据键信号产生的方式不同,键可分为亮度键和色度键。传统的键控主要是通过切换台的门控信号形成电路和混合效果放大器,以通道混合的方式实现的。而当今数字图像合成技术是以层混合的方式实现的,即通过对计算机中存储参与合成的各层图像信息的帧存储器中的对应像素数据进行各种方式的合成运算实现。随着实现手段的进步,数字图像合成的方式、种类已不再局限于抠像(当然,抠像仍是目前最常用的合成手段),有了很大程度的拓展。主要包括以下几种方式:
1.Alpha混合:Alpha通道首先在单帧静止图像的合成(平面设计、制作)中广泛使用,后随着计算机图形图像处理技术开始应用于影视节目制作。Alpha是指线性键,在帧存中,每个像素以R、G、B-Alpha 32比特结构(或Y、Cr、Cb-Alpha 24比特结构,但前者做混合时较简单)存储, 其中Alpha通道为8比特的透明度控制信息,它实质是一层256级的灰度图,对应可产生256阶渐进透明叠现效果,可用作键信号。合成时,灰度图的各点值与前景图像的各像素值一一对应,对应黑色部分(Alpha值为0)的前景图像是完全透明的,露出背景,对应白色部分(Alpha值为255)的前景图像是完全不透明的,只显示前景,对应灰度部分时,前景和背景按比例融合:合成图像=前景图像×Alpha/255+背景图像×(1-Alpha/255)。Alpha通道信息可来源于色键,或由图像处理软件制作出的黑白图像,或由图像处理软件和二维、三维动画制作软件在计算机图形生成过程中自动产生。因此Alpha混合多用于包含静止图像、字幕、二维和三维动画的图像合成。
2.遮罩合成:它是数字图像合成中必备的法宝之一,其合成原理与Alpha混合很相似,但遮罩是以独立的层的形式参与合成,控制前景、背景的合成比例,而不是附属于前景图像的一个通道信息,因此应用更灵活。遮罩可以来源于Alpha通道,或任何经过处理得到的黑白图像、视频,如彩色变黑白处理。同时作为独立的一层,遮罩可以使用任何能应用于图像层的效果、特技,如:柔化、运动等。
3.三维空间合成: 在现实中人的眼睛看到的物体均处于三维的空间中,但受显示屏幕的约束,制作人员只能针对二维的显示画面进行创作。早期的图像合成一般是在X、Y两个坐标轴构成的二维空间中以叠显的方式合成。而如何在二维的画面中体现出三维的空间层次感始终是创作人员和开发人员的一个追求。三维空间就是在二维的基础上加入深度Z轴的概念而形成的,因此,三维空间合成又称为深度键合成,作为合成控制信息的Z轴数据即为深度键。三维空间合成将近似于三维动画软件的建模环境引入了合成空间,同样拥有XYZ三维空间、灯光和产生观察视角的摄像机,但建立的对象不再是由数以万计的多边形构成的三维物体,而是若干个厚度很薄的二维图像画面。处于三维空间中的各图像画面会因观察视角的不同,因各自所处位置、角度即深度信息的不同而产生不同的遮挡关系、透视关系、聚焦关系和阴影,与二维合成相比较,能够产生空间感、透视感更强的合成画面,提供给制作人员更广阔的创作空间,但同时会带给系统更巨大的运算量和合成时间。
除此之外,还有无需通道、遮罩等其他控制信息而对前景图像和背景图像数据直接运用某种算法而进行叠加合成的方式。目前很多的图像处理工具中都包含了多种方式的叠加处理方法,如何理解这些不同的叠加方式呢?其实每一种不同的叠加方式所对应的都是一种算法。比如说screen(屏幕)模式,它代表前景和背景图像进行逐像素的比较,保留的是二者当中亮度的值比较高的一个。这样,你将会获得一幅较亮的画面。而multiply(相乘)模式则相反会得到一幅较暗的图像。通过不同的算法组合,还可以实现似柔光、强光、负片等效果的合成。这种方法非常广泛的被用在粒子合成,高级校色(比如用视频模拟胶片效果,亮度键控局部调色等)等应用之中,是目前后期合成技术的热点问题之一。
二 合成技术的应用前沿
在合成方式不断丰富的同时,数字图像合成领域还发展了许多优化合成性能的关键技术:
1. 差别键控技术:传统色键技术是依靠前景图像的色度分量产生键信号,因此要求前景是在高饱和度的单色幕布前拍摄出来的人或物。而差别键控技术则突破了这一约束,它可以将待抠像的演员置身于复杂的场景。为从复杂的场景中抠出演员的键信号,还需要一与前景画面完全相同但仅不包含演员的参照画面,然后对前景帧存和参照帧存数据逐帧进行逐像素的差值比较,差值为零(或差值足够小)的部分被抠除,反之保留,从而产生键信号控制前景和背景的合成(因对参照画面要求较高,前景画面和参照画面多采用同一时间段、同一固定摄像机位)。因受目前拍摄、制作习惯的限制,差别键控技术并未得到广泛的应用。
2.运动跟踪技术:图像合成的对象往往是活动视频或动画序列,合成时常需要将各层图像中的运动元素的运动关联起来,能够达到同步运动的效果。运动跟踪技术建立在图像分析技术和图像块运动最佳匹配搜索技术的基础上,首先跟踪和捕获源图像中某运动元素的运动轨迹、运动特征,包括平移、旋转和缩放,然后将其应用到待与之同步运动的元素上。该运动跟踪可以是一点跟踪,或两个关键点连成线段的两点跟踪,甚至是多个关键点及其连线构成的多点跟踪,运动数据可应用于遮罩、色彩和选区的跟踪。
3.色彩匹配技术:参与合成的图像常因来源不同而带有色调差异,为达到真正融合的合成效果,传统影视制作中,多根据基准画面采用手动调节各层图像的各个通道值(YUV或RGB),大大增加了制作人员的工作量和难度。色彩匹配技术在一定程度上解决了这一问题,它首先对各层图像数据进行分析,获得每层图像的亮度和色度(或RGB值)分布的统计特性,然后以制作人员指定层的分布情况为基准,自动调整其它各层的分布特性,与基准图像相匹配,以达到合成图像总体色调的统一。
4.遮罩处理技术:为达到前景图像和背景图像的无缝合成,对遮罩的优化处理始终是数字图像合成技术的发展重点之一。对遮罩的处理技术包含的方式很多,如使用垃圾键(track matte)对遮罩进行补充,进一步抠除前景中未被遮罩抠除的部分;通过调整遮罩的灰度直方图(描述遮罩像素的灰度的统计分布情况)消除键信号中的灰度即半透明的区域;对遮罩边缘使用适量像素的均值模糊运算,使合成边缘柔和;对通过不同方式得到的遮罩数据进行适当的与、或等逻辑运算,而产生更佳的遮罩边缘;等等。
5.摄像机运动的反求:用于正确得到实景拍摄的素材中的摄像机信息,并将这些数据导入到合成系统或是3d软件中,以获得和实拍素材一样的摄像机运动路径。再由这些摄像机空间运动路径信息控制虚拟场景信息,就可以获得逼真的三维和实景结合的神奇效果,与虚拟演播室的摄像机运动跟踪技术很相似,但在虚拟演播室中是依靠前期拍摄的机械跟踪、红外跟踪或背景专用网格的分析数据,而在此是指在后期制作中只根据前期拍摄到的图像,通过精密的图像分析而实现,这是目前的合成技术的一个热点也是难点问题。用于获取摄像机的反求结果的软件系统还不多,主要包括2D3公司生产的boujou,以及美国汉诺威大学推出的Voodoo Camera Tracker等等,相信在很短的一段时间内,这种技术将会更多的被应用于现代的影视制作之中。
三 主流合成系统的简介
图1
图2
图3
主要有两个因素制约着合成系统的性能指标:硬件平台和软件。
从硬件上来看比较昂贵的系统大多是构建在SGI图形工作站上。而比较廉价的系统大多建立在MAC和PC上。为什么SGI如此昂贵?主要原因在于它对图像处理方面所做的优化和超高的运算能力,一般在PC上处理图像的精度是8比特,而SGI均使用16比特处理,这样处理的精度当然要高得多,对图像的损失也被减小到最小。而在采样方面,一般的合成系统的采样精度只能达到8比特,而SGI的采样精度为10比特,加上SGI超高的稳定性,当然会在很大程度上提高工作的效率。一般处理胶片级别的画面时均采用SGI工作站。PC的优势当然是价格便宜,而且升级比较快,目前PC在处理画面的能力上已经有了很大的提高,但是在稳定性方面还是有待加强。
软件方面,Discreet公司在合成方面的霸主地位很难被撼动,从高端的架设在SGI Onyx工作站上的Inferno,到架设在SGI Octane2 上的flame和flint,再到PC上的Combustion,已经形成了比较完善的全系列产品线。但是APPLE公司去年合并了Nothing real 公司的强大的shake,并且宣布只对MAC的用户,使得Shake成为了一款倍受瞩目的软件。Shake有着清楚的节点型构架和16比特的处理能力,支持非线性色域处理,是合成软件领域一颗冉冉上升的明星。而在中国目前的应用领域使用的最多的还是ADOBE公司的After effects,它的好处在于基于层的合成概念,支持众多的厂商开发的外挂插件,能够满足众多的常规电视节目制作,甚至包括网络设计,平面设计的要求。而且,它的价格比较便宜,学习资料非常丰富,因而,一直是中国的用户最为推崇的一款合成工具。
除了以上的主流工具的介绍以外,maya fusion ,digital fusion和5d cyborg 也是非常好的工具,也拥有广泛的群众基础。
图像合成技术的发展,对制作行业产生了非常大的影响,它开拓了制作者的眼界,启迪了创作者的思维,使得制作的工艺流程变得丰富和复杂起来。一种非常典型的趋势是,更多的合成技术会被渗透和集成到主流的剪辑工具中。比如说AVID在自己的剪辑工具中大多都集成了颜色匹配功能(图1),而Premiere的最新版本(图2),苹果的剪辑工具final cut pro(图3)也都相应地集成了类似的功能在之中。
总之,数字图像合成技术已经成为了现代制作流程中必不可少的重要手段,随着人们对这方面认识的提高,它一定会被更广泛的应用到作品中。
2ASK、2FSK、2PSK数字调制系统的Matlab实现及性能分析与比较
引言:数字带通传输系统为了进行长距离传输,克服传输失真,传输损耗,同时保证带内特性。必须对数字信号进行载波调制,将信号频谱搬移到高频段才能在信道
展开阅读全文