1、信息记录材料 年 月 第 卷第 期基于立体视觉的雪地目标跟踪技术韩镒璘,王新语,谢艳秋,赵 峥(通信作者)(佳木斯大学经济与管理学院 黑龙江 佳木斯)(佳木斯大学体育学院 黑龙江 佳木斯)(佳木斯大学机械工程学院 黑龙江 佳木斯)(佳木斯大学 黑龙江 佳木斯)【摘摘要要】双目立体视觉是一种 视觉的常用实现方法,本研究旨在研究基于立体视觉的雪地目标追踪技术。首先分析了雪地中目标的特征,并提出了使用卷积神经网络进行目标识别的方法。其次结合视差计算和距离估计,实现了目标的距离判别。最后为了验证算法的有效性,构建了一个数据集,并使用该数据集进行卷积神经网络的训练和测试。实验结果表明,所提出的方法能够准
2、确识别雪地中的目标,并有效地估计目标的距离。【关关键键词词】立立体体视视觉觉;目目标标检检测测;深深度度学学习习;视视差差计计算算【中中图图分分类类号号】【文文献献标标识识码码】【文文章章编编号号】()基金项目:年黑龙江省大学生创新训练项目“基于 视感的冰雪面移动机器人目标跟踪”()。作者简介:韩镒璘(),女,黑龙江佳木斯,本科,研究方向:会计电算化。引言随着社会的不断发展和科技的迅猛进步,机器人、无人机等智能设备在各个领域的应用日益广泛。然而,当前的目标跟踪技术在复杂的雪地环境下仍然面临着一系列挑战。雪地环境的特殊性质,例如强烈的反射和散射效应、低对比度、深度感知的困难以及目标与背景之间模糊
3、的边界等,使得传统的目标跟踪方法往往无法满足精确和稳定的跟踪需求。因此,开发一种基于立体视觉的雪地目标跟踪技术成为解决这一问题的关键。本研究旨在分析雪地中目标的特点,并基于卷积神经网络实现目标识别,结合视差计算和距离估计实现目标的距离判别。通过利用立体视觉提供的丰富深度信息,可以有效地克服雪地环境的复杂性,实现高精度的目标跟踪。基于立体视觉的雪地目标检测与识别 雪地图像特征分析如图 所示,在雪地中目标图像具有独有的特征,此特征对目标跟踪技术的设计和实施提出了挑战。雪地环境中的光线会发生强烈的反射和散射,导致目标图像的亮度和对比度变化较大,这种现象会使得目标的边缘和细节变得模糊,降低了目标识别和
4、跟踪的准确性;由于雪地的亮度较高且均匀,目标与背景之间的对比度较低,这使得目标在图像中不易与周围环境进行明显区分,增加了目标检测和识别的困难;由于雪地的纹理较为单一,难以提供明显的深度线索,因此,在雪地中准确估计目标与相机之间的距离是一项具有挑战性的任务,需要利用其他视觉信息来辅助深度感知;雪地的纹理和颜色变化较小,且常常存在大面积的连续白色背景,使得目标与背景之间的边界模糊,这种背景干扰增加了目标检测和跟踪的难度,容易引起误识别和漂移现象。图 雪地里的一个典型目标 基于卷积神经网络的目标识别所提方法首先利用卷积神经网络对雪地中的目标进行识别,然后对目标矩形的中心点进行检测计算,以估计目标的距
5、离。如图 所示,在卷积神经网络进行目标识别阶段,输入一张雪地图像,表示为 ,其尺寸为 ,其中 和 分别为图像的宽度和高度,为通道数。卷积层是卷积神经网络的核心组件。它利用一组可学习的滤波器(卷积核)对输入图像进行卷积操作,提取图像的特征。卷积操作通过滑动窗口在图像上移动,并在每个位置进行元素乘法和加法运算。卷积层的输出由多个二维特征图组成。在卷积操作中,假设输入特征图为 ,卷积核为,输出特征图为 ,则可以表示为式():()()式()中,表示卷积操作,表示偏置项,表示激活函数。卷积操作可通过设置不同的卷积核大小、步幅和填充方式来控制特征图的大小和维度。池化层用于对卷积层的输出进行下采样,减少特征
6、图的尺寸。常用的池化操作包括最大池化和平均池化。池化层通过滑动窗口在特征图上移动,并在每个窗口中取最大值或平均值作为输出。假设输入特征图为 ,池化操作的窗口大小为 ,步幅为,则最大池化的输出 可以表示为式():信息记录材料 年 月 第 卷第 期(,)(,)()式()中,为池化窗口的大小,表示通道数。全连接层用于将卷积层和池化层的输出特征映射到目标类别的分数。全连接层中的每个神经元与前一层的所有神经元相连接,通过学习权重参数来实现特征的线性组合。假设卷积层和池化层的输出特征为 ,全连接层的权重矩阵为 ,偏置项为 ,激活函数为 ,则全连接层的输出 可以表示为式():()()输出层用于对全连接层的输
7、出进行分类。通常使用 函数将网络输出转化为概率分布,表示每个类别的概率。假设全连接层的输出为 ,输出层的权重矩阵为 ,偏置项为 ,函数为 ,则输出层的输出 可以表示为式():()()通过训练数据和反向传播算法,卷积神经网络能够学习到图像中的特征表示,并在目标识别任务中实现高准确度的分类和定位。图 卷积神经网络的工作方式 视差计算与距离估计在立体视觉中,目标经由卷积神经网络识别后,需要通过矩形框定位目标,并利用两幅图像之间的视差差异来估计目标的距离。在目标定位时,通过卷积神经网络的输出,可以获得目标在图像中的位置和尺寸信息。假设卷积神经网络的输出为,其中每个元素(,)表示对应位置的目标得分。可以
8、通过阈值处理和连通域分析等方法,确定目标在图像中的位置,并绘制一个矩形框来框定目标。立体视觉系统中通常包含两个相机,分别为左相机和右相机。利用这两个相机获取的图像,可以获得左视图和右视图。首先假设左视图为(,)(和 分别表示像素的水平和垂直坐标),右视图为(,)。然后进行视差计算。视差是指左视图和右视图中对应像素之间的水平位移。通过计算视差,可以获取目标在左视图和右视图中的对应位置。视差计算的方法可以使用块匹配算法,假设目标在左视图中的像素位置为(,),在右视图中的像素位置为(,),则视差 可以通过式()计算得出。()通过视差信息,可以估计目标与相机之间的距离。视差和距离之间存在一种近似的线性
9、关系,可以通过摄像机的内参和外参来计算。假设 为相机的焦距,为两个相机之间的基线距离,则目标距离相机的距离 可以通过式()计算得出。()式()中,为前一步骤中计算得到的视差值。实验与分析 数据集在实验中,根据 网络爬虫捕获雪景图片以构建数据集(数据集的部分图片如图 所示),使用该数据集对卷积神经网络进行训练。()网络爬虫的准备:首先准备一个 开发环境,并 安 装 相 关 的 爬 虫 库 和 工 具,包 括 库、库等。然后可以发送网络请求,解析超文本标记语言(,)页面,并提取所需的图片统一资源定位符(,)。()网络请求与页面解析:网络爬虫向目标网站发送超文本传输协议(,)请求,获取包含雪景图片的
10、网页。库可以方便发送 请求,并获取返回的网页内容。使用 库对网页进行解析,提取出图片标签及其相关属性信息。()图片 提取:在解析网页时,需要通过 标签和属性信息,提取出图片的。通过 库提供的方法,可以轻松地定位图片标签,并获取其对应的。()图片下载与保存:获取到图片 后,使用 的图像处理库(,)中的函数,将图片下载到本地。通过发送 请求获取图片内容,并将其保存为文件。()数据集构建:通过循环遍历上述步骤,可以持续地获取雪景图片,并将其保存到指定的文件夹中。可以根据实际需求设置获取的图片数量和存储的文件命名规则,以构建具有多样性和丰富性的雪景图片数据集。图 数据集的部分图片 训练与测试使用该数据
11、集进行卷积神经网络的训练和测试可以信息记录材料 年 月 第 卷第 期按照以下步骤进行:()数据集划分:数据集划分为训练集和测试集,本实验的划分比例是将数据集的大约 用作训练集,用作测试集。确保数据集的划分是随机的,以避免训练集和测试集之间的偏差。()数据预处理:在训练和测试之前,需要对数据集进行预处理。这包括图像的加载、大小调整、归一化等操作。()网络架构设计:根据任务需求和数据集特点,设计卷积神经网络的结构,网络的设计涉及卷积层、池化层、全连接层、激活函数的选择以及超参数的设置。()网络训练:使用训练集对卷积神经网络进行训练。训练过程中,通过反向传播算法更新网络的权重参数,使其逐步适应数据集
12、的特征。训练过程中需要选择合适的优化算法(如随机梯度下降法)、损失函数(如交叉熵损失函数)以及训练的迭代次数。()模型评估:使用测试集对训练好的卷积神经网络进行评估。评估指标可以包括准确率、精确率、召回率、值等,用于衡量模型的性能和泛化能力。通过评估结果可以判断网络的训练效果,并对网络进行优化和调整。()模型应用:在训练和测试阶段完成后,可以使用训练好的卷积神经网络对新的雪景图像进行分类、识别或其他任务。可以将网络部署到实际应用中,实现自动化的目标识别等功能。结果与分析当将图像输入已经训练好的卷积神经网络中时,可以通过以下方式实现对识别目标的矩形框标注:()前向传播:将输入图像通过卷积神经网络
13、进行前向传播。在前向传播过程中,图像将经过一系列的卷积层、池化层和全连接层,最终生成网络的输出结果。()目标识别:通过前向传播,卷积神经网络可以对输入图像进行目标识别。在输出层的概率分布中,每个类别对应的概率值表示图像中存在该类别目标的可能性。()概率阈值处理:为了筛选出置信度较高的目标识别结果,可以设置一个概率阈值。将输出层中每个类别的概率与阈值进行比较,若大于等于阈值则认为该类别的目标存在,若小于阈值则认为该类别目标不存在。()矩形框标注:针对被识别为目标的区域,可以使用矩形框进行标注。可以根据目标在图像中的位置信息,绘制一个框来围住目标区域。通常框的位置由目标的边界框的左上角和右下角坐标
14、确定。图 雪地目标识别的结果当使用视差原理计算双目立体视觉中的目标距离后,可以使用表格形式来分析距离误差,如表 所示。表 基于立体视觉的雪地目标跟踪技术的测距结果编号计算距离 实际距离 误差 表 的每一行代表了在双目立体视觉的左右图像中标记的一个目标。“目标编号”列用于唯一标识每个目标,“计算距离”列表示使用视差原理计算得到的距离值,“实际距离”列包含目标的实际距离,可以通过独立测量或已知值获得,最后,“误差”列显示了计算距离与实际距离之间的绝对差值,表示距离估计的误差大小。表 中,距离估计的误差主要集中在 以下,并且大多数情况下误差在正负 范围内。这表明该距离估计方法在 的距离内能够较准确地
15、估计目标的距离,但在某些情况下可能存在略微误差。结论与展望综上所述,本文针对雪地目标追踪问题,提出了一种基于立体视觉的解决方案。通过分析雪地中目标的特征,并利用卷积神经网络进行目标识别,能够准确地识别出目标。结合视差计算和距离估计实现目标的距离判别。为了验证算法的有效性,构建了一个数据集,并进行了训练和测试。实验结果表明,所提出的方法在雪地目标追踪任务中取得了良好的效果。未来的研究可以进一步优化算法,提高目标识别和距离估计的准确性,并探索更广泛的应用领域。本研究对于增强雪地环境下目标追踪技术的发展具有一定的参考价值。【参考文献】王祥科,刘志宏,丛一睿,等 小型固定翼无人机集群综述和未来发展 航空学报,():王会芝 工业机器人在智能制造中的应用 南方农机,():卢艳军,王诗宇,张太宁,等 针对目标跟踪过程的双目视觉测距方法研究 电光与控制,():,李鹏飞,田瑜,张蕾,等 双目视觉运动目标跟踪定位系统的设计 测控技术,():周飞燕,金林鹏,董军 卷积神经网络研究综述 计算机学报,():
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100