资源描述
BP 神经网络在疾病预测中的应用
【摘要】 目的: 探讨 BP 神经网络在疾病预测中的应用。方法:
设计合适的 BP 神经网络模型,用 Matlab7.0 编写模型程序,利用精神
分裂症影响因素拟合模型。结果:BP 神经网络在精神分裂症发病与否
的预测中取得了较好的效果。结论:BP 神经网络在流行病学中有良好
的应用前景。
【关键词】 BP 神经网络; 疾病预测; BP 算法; 精神分裂症
BP 神经网络是人工神经网络的一种,它通过模仿生物大脑神经
系统信息处理功能实现输入与输出之间的任意非线性优化映射,有着
传统统计方法无法比拟的适应性、容错性及自组织性等优点,特别是
用传统统计方法效果不好或不能达到目的时, 采用 BP 神经网络往往能
收到较好的效果,它在疾病预测中有着广阔的应用前景。
1 BP 神经网络基本结构及 BP 算法基本原理
BP 神经网络的基本处理单元是神经元(即节点) 大量神经元广 ,
泛连接构成神经网络。BP 网络通常含有输入层、隐含层(中间层)和
输出层,每层均包括多个神经元,输入层与输出层各有一层,隐含层
根据需要可以设多层,也可不设。神经元之间通过权相互连接,前一
层神经元只对下一层神经元作用,同层神经元之间无相互作用,权值
1
的大小代表上一级神经元对下一级神经元的影响程度,如图 1 所示。
网络中作用于神经元的激励函数通常采用的是 S 型函数(sigmoid 可
微函数) ,见式(1) 。
f(x)=(1+e-Qx)-1(1)
式中 Q 为调节激励函数形式的参数,称增益值。Q 值越大,S 形
曲线越陡峭;反之,曲线越平坦,通常取 Q =1。
BP 算法(Back Propagation) 是为了解决多层前向神经网络
的权值调整而提出来的,也称为反向传播算法,即网络权值的调整规
则是向后传播学习算法,具体来说,BP 算法是建立在梯度下降法的基
础上的,训练过程由正向传播和反向 传播组成,在正向传播过程中,
输入信息由输入层经隐含层逐层处理,并传向输出层,如果输出层得
不到期望的输出,则转入反向传播,逐层递归的计算实际输入与期望
输入的差即误差,将误差信号沿原来的连接通道返回,通过修改各层
神经元的权值,最终使得误差信号最小。
2 BP 网络的建模过程及模型设计要点
在流行病学中,可以应用 BP 网络建立疾病的预测模型,建模的
基本过程如下:首先收集导致疾病发生的主要影响因素及疾病发生的
结果;然后把影响因素及疾病结果输入到设计好神经网络模型中进行
2
反复训练,直到网络收敛(即达到预期的训练误差) 在训练过程中可 ,
适当采用一定的技巧使网络的训练速度最快、误差最小、模型最优;
最后用建立好的模型进行疾病预测。下面具体探讨网络模型的设计要
点。
2.1 确定训练样本
训练样本应来源于研究总体的一个随机无偏样本,并且按随机、
对照、重复及盲法等原则收集资料、整理资料、分析资料,保证训练
结果的无偏性。训练样本含量适宜,含量过大会造成训练速度偏慢,
训练结果过分逼近训练集(或者说是该研究的外部真实性较差) 使得 ,
网络的推广泛化能力降低,况且,大样本的收集大大增加了工作量;
样本过小其代表性不够,使训练结果不够可靠(或者说是该研究的内
部真实性较差) 一般来说,网络的结构越复杂,所需样本越多,结构 。
越简单,所需样本可相应减少。对于单层 BP 网络可参照 Logistic 回
归对样本含量的一般要求,当样本含量与连接权的个数比为 10:1 时
[1] 就基本能够满足要求,多层 BP 网络的样本量应在此基础上根据 ,
网络的复杂程度适当增加。
2.2 变量值的归一化处理
归一化处理的目的是把变量值归一到区间[-1,1]内,此原因大
3
展开阅读全文