资源描述
第一章 PPT
P11 什么是计算机视觉
1. 采用计算机实现人类视觉的功能
2. 让计算机理解图像和视频
P12 计算机视觉与图像处理的区别
图像处理侧重在“处理”图像:如增强,还原,去噪,分割,等等;而计算机视觉在于使用计算机(也许是可移动式的)来模拟人的视觉,因此模拟才是计算机视觉领域的最终目标。要实现这个目标,至少有两件事要做,第一是图像处理,第二是图像理解。比如一个机器人眼睛读入的数据可能是模糊的,可能是有噪声的,那么首先要进行去噪和还原。之后机器人要能理解这个图像意味着什么,比如特定的军事目标,那么它可能要进行分割,然后用统计学的方式进行模式识别。显然识别这个部分就属于图像理解,而非单纯的图像处理了。
P14-20 计算机视觉中存在哪些难点和挑战
外观,大小形状,运动,复杂的姿态,外观变化,视点变化
P23-28 图像中存在哪些计算机视觉线索
深度线索:直线透视,空间透视
远近顺序线索:遮挡
形状线索:纹理梯度
形状和光照线索:阴影
位置和光照线索:投影
P30-46 计算机视觉有哪些典型应用
智能汽车,无人驾驶车
人脸识别,表情识别,机器人
P48 CCD/CMOS传感器的成像原理:光电转换
P49-54 采样与量化影响图像的哪些属性
采样:采样的频率
量化:灰度级
P61 图像坐标系
图像左上角为图像坐标系原点,即(0,0点
P75-78 像素距离与邻域关系
欧式距离:
城区距离:
棋盘距离:
4邻域,对角邻域,8邻域
习题
第三章 PPT
P11 薄透镜成像模型
P17-21 射影几何中哪些物理信息丢失和保留了?
丢失:长度,角度
保留:直线特性,交比不变性
P22-24 灭点和灭线的概念
场景中的平行线投影到图像平面后,会聚于“灭点” 场景中无尽远处的天与地连接成线,灭线。
P46-49 像机成像过程中包含了哪些内参和外参?
像机内参fx : u轴尺度因子,或称u轴归一化焦距fy : v轴尺度因子,或称v轴归一化焦距γ : u轴和v轴的不垂直因子,通常为0u0, v0 : 光学中心像机外参R: 像机旋转矩阵T : 像机平移矩阵
P51 像机标定的目的,思路和基本方法
目的:确定像机的内参和外参。思路:通过一组已知世界坐标的图像特征点,建立超定方程求解。方法:最小二乘求解超定方程,寻找最优估计。
P63 径向畸变和切向畸变的概念
dr为极坐标的幅度变化量,表现为径向畸变。dt为极坐标的角度变化量,表现为切向畸变。
习题
第四章 PPT
P4-7 图像平移、尺度、旋转和级联变换
P14 最近邻插值
P16-18 双线性插值
第一步:水平方向线性插值
第二步:垂直方向线性插值
P20-31 图像灰度映射
P31-32 直方图的概念和意义,用已学过的数学原理进行解释
概念:图像中各灰度级出现频数分布的统计图表
意义:反映各灰度级出现频数的分布情况,进而反映图像对比(清晰度,但不反映各灰度级的空间位置分布
P40 直方图均衡计算
书本p66例子,g=int[(L-1)*gf+0.5] L代表8 表示灰度级
P52-66 模板滤波的概念和理解
P69 中值滤波概念和基本步骤
选择局部窗口中亮度的中间值代替窗口中心像素
步骤:将模板中心与图像中某像素位置重合读取模板下各对应像素的灰度值将这些灰度值从小到大排成一列找出这些灰度值里排在中间的一个将这个中间值赋给对应模板中心位置像素遍历图像中所有像素
P71 中值滤波与均值滤波的比较
1、中值滤波可有效消除突变 线性滤波总是响应所有的变化2、中值滤波具有部分不连续保持特性 线性滤波会产生平滑过渡的效果
习题
第五章 PPT
P4 为什么要边缘检测
提取信息,识别目标恢复几何和视点
边缘的成因
曲面法线不连续
深度不连续
表面颜色不连续
亮度不连续
P10-21 用已学过的数学原理解释边缘检测的原理
P15 有哪些一阶导数算子?试写出其模板形式
P21 有哪些一阶导数算子?二阶导数算子会对噪声敏感,试解释原因
P28 Canny算子的最优检测0.准则
P41 什么是角点?角点有什么特性?
可重复性/可再现性同一角点应能在不同图像中检测出,不受几何和亮度等变化的影响显著性每个角点都是独特的局部性特征描述的是图像中的一个局部小区域
P43 SUSAN角点检测的基本原理
P51 Hough变换的基本思想(投票)以及为什么要进行Hough变换
边缘点或特征点检测基于单个像素。边缘跟踪无法得到完整轮廓,存在弱边缘或边缘不连续 。如何将离散的边缘点表示为更复杂的特征?
P55 Hough变换中参数空间的概念,试写出直线检测以及圆检测的参数空间
设已知一黑白图像上画了一条直线,要求出这条直线所在的位置。我们知道,直线的方程可以用y=k*x+b 来表示,其中k和b是参数,分别是斜率和截距。过某一点(x0,y0的所有直线的参数都会满足方程y0=kx0+b。即点(x0,y0确定了一族直线。方程y0=kx0+b在参数k--b平面上是一条直线,(你也可以是方程b=-x0*k+y0对应的直线。这样,图像x--y平面上的一个前景像素点就对应到参数平面上的一条直线。我们举个例子说明解决前面那个问题的原理。设图像上的直线是y=x, 我们先取上面的三个点:A(0,0, B(1,1, C(22。可以求出,过A点的直线的参数要满足方程b=0, 过B点的直线的参数要满足方程1=k+b, 过C点的直线的参数要满足方程2=2k+b, 这三个方程就对应着参数平面上的三条直线,而这三条直线会相交于一点(k=1,b=0。 同理,原图像上直线y=x上的其它点(如(3,3,(4,4等 对应参数平面上的直线也会通过点(k=1,b=0。
P68 Hough变换的优点
对边缘不连续具有较好的容忍性对噪声干扰具有较好的鲁棒性对目标遮挡具有较好的抗干扰性
习题
第六章 PPT
P2 目标分割的概念、目的、意义
概念:将图像划分成若干具有特征一致性且互不重叠的图像区域的过程
目的:有选择性地定位感兴趣对象在图像中的位置和范围
意义:区域对于图像理解和识别非常重要,往往表征场景中的目标,或部分目标。一幅图像可以包含多个目标,每个目标包含多个区域,每个区域对应目标的不同部分。图像分割是将图像划分为一组有意义的区域。
P14 图像分割有哪些方法?基于哪些特征
基于轮廓的 确定目标轮廓
基于区域的 确定属于目标的像素。
P27 图搜索有哪些策略,以及各自特点
广度优先搜索 特点?深度优先搜索 特点?启发式:启发函数,代价函数 特点?与广度和深度 优先搜索的联系?A算法和A*算法 特点?
P40 试用直方图的概念解释直方图分割的思想
P45 最优阈值的分割思想
阈值分割实质:灰度映射中的二值化方法,将图像像素分为两类:前景目标和背景
思路:使图像中目标物和背景分割错误最小的阈值。
P52 最大类间方差(OTSU的分割思想
它是按图像的灰度特性,将图像分成背景和目标2部分。背景和目标之间的类间方差越大,说明构成图像的2部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致2部分差别变小。因此,使类间方差最大的分割意味着错分概率最小
习题
第九章 PPT
P3-9 图像中包含了哪些深度线索?
阴影纹理遮挡运动模糊
P26-27 平行光轴立体视觉系统的感知深度的原理和基本公式
三角形相似定理
P32-35 75-83 立体视觉系统中有哪些约束
极线约束
立体匹配约束
P41 立体视觉标定校正的目的
输入图像通过透视变换使得外极线水平,且共线。畸变校正,使得成像过程符合小孔成像模型。
P52 立体匹配的概念及分类
立体匹配的过程:为左图像的每个像素点(xl, yl,在右图像中搜索对应点。
局部立体匹配
通常以基于局部窗口的立体匹配方法为主。匹配基元:局部窗口
全局立体匹配
匹配过程中,求解一行或整幅图像中所有像素的相似测度和最大/最小。匹配基元:像素
致密匹配搜索每个像素的对应点,构建致密视差图匹配基元为像素
稀疏匹配仅为特征搜索对应点,构建稀疏的视差图.匹配基元为特征。
P58 有哪些局部立体匹配方法??和优缺点
优点:容易实现,只需要考虑局部窗口区域对纹理丰富的区域具有较好匹配性能速度快,只需考虑有限像素易于硬件实现,易于流水线实现缺点:视差不连续、遮挡或边缘区域无法正确估计视差对重复性纹理、无/弱纹理区域无法准确估计视差
P84 全局立体匹配的思想和优缺点
展开阅读全文