1、基于P2P模式垃圾邮件过滤系统软件需求阐明书V1.0拟 制 人_审 核 人_批 准 人_二零零五年七月三十日目 录1引言11.1编写目11.2背景11.3定义11.4参照资料22任务概述12.1目的12.2顾客特点22.3假定和约束23需求规定23.1对功能规定23.1.1 数据包重定向33.1.2 IP报文队列管理43.1.3 合同分析43.1.4 袭击防护53.1.5 邮件头分析53.1.6 规则过滤73.1.7 记录分析73.1.8 查毒引擎73.2对性能规定83.2.1精度83.2.2时间特性规定83.3数据管理能力规定83.4故障解决规定84运营环境规定94.1设备94.2支持软件9
2、4.3接口94.4控制9软件需求阐明书1引言1.1编写目编写软件需求阐明书是依照华为技术有限公司高校科技基金项目“基于P2P模式垃圾邮件过滤系统”合同规定及本项目组项目开发筹划,对项目需求进行分析、定义和详细阐明,作为本课题研究开发根据,保证项目管理者和开发人员对的、完整地结识顾客需求,作为进一步实行概要设计根据。本阐明书预期读者是本项目顾客、项目管理者、研究开发人员,编程及测试人员。1.2背景a. 课题名称 :基于P2P模式垃圾邮件过滤系统b. 任务提出者:华为技术有限公司c. 开发单位 :电子科技大学d. 开发部门 :新型计算机应用技术重点实验室e. 顾客:华为技术有限公司f. 关联单位:
3、暂不假定与其她单位关联,但设计方案应考虑通用性和扩展性。1.3定义a. 垃圾邮件(Spam):垃圾邮件是指那些“违背收件者意愿”邮件,即spam或ube或uce。有别于普通合法商业广告邮件,垃圾邮件大多包括“反动、色情、暴力”信息,通过非法手段获取顾客邮箱地址,对互联网资源和顾客资源进行侵占和滥用。b. ham:非垃圾邮件(正惯顾客邮件或合法商业广告邮件);c. 内核:本文中特指linux核心,它负责管理系统进程、内存、设备驱动程序、文献和网络系统。d. 顾客空间:linux顾客态程序和进程。e. 钩子函数:本文中特指基于Linux内核netfilter模块提供Hook函数接口。f. ip_q
4、ueue:Linux内核模块,可通过netlink将内核中IP数据包传到顾客空间。g. Netfilter:Netfilter是linux2.4内核算现数据包过滤、数据包解决、NAT等功能框架。Netfilter提供了一种抽象、通用化框架,该框架定义一种子功能实现就是包过滤子系统。h. IP:网际合同i. TCP:传播控制合同j. UDP:TCP/IP合同栈中顾客数据报传播合同k. HTTP:TCP/IP合同栈中应用层合同l. SMPT:简朴邮件传送合同m. POP3:邮局合同第3个版本n. MIME:多用途互联网邮件扩展1.4参照资料a. 计算机软件工程规范国标汇编,中华人民共和国原则出版社
5、;b. GB/T 16260 信息技术软件产品评价质量特性及其使用指南,中华人民共和国原则出版社;c. 基于P2P技术垃圾邮件分析、检测与过滤项目合同,华为技术有限公司d. 基于P2P模式垃圾邮件过滤系统项目开发筹划,电子科技大学新型计算机应用技术重点实验室2任务概述2.1目的本课题研究目的是研究基于P2P模式垃圾邮件过滤核心技术,设计并实现基于透明网桥技术反垃圾邮件网关模型,该模型综合采用基于记录和智能评分反垃圾邮件最新技术成果,支持黑白名单和反向DNS等常规反垃圾邮件技术,支持邮件病毒在线查杀。该课题预期研究成果为反垃圾邮件透明网关系统原型和有关专利申报材料及关于技术文档资料。本软件应用目
6、的是为国内各级ISP、邮件服务提供商(MSP)以及公司内部邮件服务器顾客提供垃圾邮件过滤服务,防范和遏制垃圾邮件(特别是蠕虫类、病毒类和Phishing类垃圾邮件)泛滥。本软件开发意图是设计并实现一种具备智能邮件分类和过滤能力透明垃圾邮件网关模型,该模型可以简朴地串接在受保护域网络出口处,对流经网关SMTP流量进行合同分析和内容过滤,而不影响其她合同数据流量。采用该产品,无需配备DNS记录和IP地址,可以最大限度地以便顾客使用。并且采用串联方式接入,系统可以对垃圾邮件流量实行在线阻断(区别于既有基于“存储转发”模式邮件网关产品),该特性使得本系统具备良好功能扩展性,通过扩展相应解决模块,具备针
7、对垃圾邮件群发工具和针对邮件服务器和邮件网关分布式回绝服务袭击进行防范能力,并可以支持基于行为垃圾邮件过滤(下一步工作方向)。系统布置示意图如图1所示:本软件产品可以独立布置,也可以采用原则接口加入到反垃圾邮件综合防治体系中与其她反垃圾邮件工具和产品交互,协同防范和遏制垃圾邮件,特别是蠕虫邮件泛滥。2.2顾客特点本软件最后顾客是华为技术有限公司,操作人员和维护人员均为熟悉LINUX操作系统,有一定操作系统管理和维护能力计算机网络与信息安全有关专业专业人员。本软件预期使用频度:52724(hours per year),网络带宽环境为千兆公司内部网络,因而,执行软件开发和测试有关设计工作时应充分
8、考虑系统执行效率、安全性和健壮性,以及劫难恢复能力。2.3假定和约束本软件开发工作经费限制为基于P2P技术垃圾邮件分析、检测与过滤项目合同规定项目经费额度(人民币大写:拾万元整)。本软件开发开发期限为07月01日至06月30日。3需求规定 3.1对功能规定本系统总体功能概述:本系统以串行方式布置在邮件服务器前端,对流经邮件网关SMTP流量进行检查,实时拦截和阻断垃圾邮件。系统对于非SMTP流量不产生任何影响(对顾客完全透明),对于SMTP流量则一方面根据TCP/IP合同进行合同分析,还原出所需合同信息(如:地址、端口信息)和某些原始SMTP会话信息(如:邮件头信息),并依照SMTP会话行为特性
9、判断邮件服务器与否收到袭击,如果确认该SMTP会话为袭击行为,则及时实行阻断。若该会话不能确以为袭击,则逐个放行IP数据报(同步复制一份该数据报拷贝到顾客空间进行会话还原和解码)直至该会话结束前最后一种报文,对该报文实行截留(记录到IP报文队列中),并对顾客空间邮件副本实行垃圾邮件过滤操作(邮件头分析、规则过滤、记录分析、邮件查毒)。若邮件过滤操作鉴定该邮件为垃圾邮件,则及时予以阻断,并记录该垃圾邮件信息备查;若鉴定该邮件非垃圾邮件,则予以放行。垃圾邮件透明网关系统数据流与加工规定示意如图1所示。下面依照加工顺序逐项阐明各输入输出数据类型,加工需求和输人输出规定。3.1.1 数据包重定向功能需
10、求概述:数据包重定向模块工作在数据链路层,在边界路由器和邮件服务器之间形成一条透明通道,在不变化网络配备以及不让服务器知晓状况下,对通信流量进行选取性解决,对于SMTP流量进行重定向和转发操作。该模块使得本系统具备对SMTP流量进行实时过滤和阻断能力。输入:来自Internet网络流量加工:来自Internet网络流量流经本系统网桥时,被重定向到neitfilter模块进行流量选取,其中SMTP流量被选取出来,除SMTP会话最后一种数据报被截留外,别的SMTP报文被转发,同步复制一份到顾客空间执行合同分析和会话还原。别的非SMTP流量被原封不动地被转发到目主机。输出:复制、截留并转发SMTP报
11、文;转发非SMTP流量(分别相应图1中标号)数据包重定向数据流与加工规定示意如图2所示。3.1.2 IP报文队列管理输入:合同类型为TCP,目端口是25IP报文加工:IP报文队列管理模块作为内核模块运营,对通过报文选取得到SMTP报文进行复制和转发。复制得到报文副本提交给顾客空间合同分析程序进行SMTP会话还原。对于原始报文,若该报文并非标记SMTP会话结束,则对该报文执行转发操作;否则截留该报文,依照顾客空间垃圾邮件过滤程序返回成果决定转发或者丢弃该报文。输出:输入报文被复制一份到顾客空间,原始报文被原样转发3.1.3 合同分析输入:从IP报文队列中复制得到合同类型为TCP,目端口是25IP
12、报文加工:合同分析模块输出:完整电子邮件文献合同分析数据流与加工规定示意如图3所示。3.1.4 袭击防护功能需求概述:袭击防护模块功能需求可以概括为三类: 资源消耗类袭击防护(防范大量非法联接祈求袭击,多线程袭击,回绝服务(Dos)及分布式回绝服务(DDos)袭击); 合同误用类袭击防护(防范字典算法袭击,虚假路由袭击,欺骗陷阱(Spoofing)袭击); 有害内容类袭击防护(防范多重病毒袭击,诱饵(Phishing)袭击)。按照上述分类,袭击防护模块可以划分为三个子模块,分别相应于上述三类袭击防范。其中,资源消耗类袭击防护和合同误用类袭击防护逻辑上布置于基于邮件头分析垃圾邮件过滤功能模块之前
13、,运用底层合同分析成果和邮件头中相应合同信息分析并阻断袭击行为。有害内容类袭击防护属于基于内容垃圾邮件过滤范畴,其功能需求包括于参加相应“规则过滤”和“查毒引擎”某些(设计实现也在相应某些予以考虑,此处不列入需求)。输入:TCP/IP合同头信息,邮件头信息加工:运用反向DNS查询检测并阻断非法联接祈求袭击;构建垃圾邮件特性群发工具检测并阻断多线程袭击;通过度析邮件头信息中MAIL FROM和RCPT TO字段关联关系检测并阻断字典算法袭击;通过度析邮件头信息中邮件路由信息进行分析得到邮件从发送地址到最后接受地址完整路由,检测并阻断虚假路由袭击所;采用专门检测机制防范欺骗陷阱(Spoofing)
14、袭击和分布式回绝服务(DDos)袭击。输出:阻断袭击性连接,对正常邮件连接予以放行(0:accept; 1:block);3.1.5 邮件头分析功能需求概述:为了逃避各国司法机关调查,规避互联网服务提供商和邮件过滤程序检查和过滤,垃圾邮件发送者普通会采用伪造发件人信息来发送垃圾邮件,这在给垃圾邮件实时发现和事后追查制造了障碍同步,也给反垃圾邮件技术留下了某些可以运用线索。本项目组在充分调研已有科研成果和商业产品所采用有关技术基本上,总结并抽取出12项垃圾邮件特性头信息,定义为本产品自有、可扩充垃圾邮件头特性集合。通过上述邮件头分析,本产品应可以在内容检查前过滤超过70%垃圾邮件。输入:邮件头信
15、息加工:邮件头分析所采用垃圾邮件特性头信息集合为:其中特性Ai(i =133)功能需求定义如下:l A0:邮件中继次数,即邮件头中“Received”标签个数;l A1:收件人个数;l A2:邮件路由信息中中断次数,邮件路由信息中断定义为:若前一条“Received”标签中接受站点域名和IP与后一条“Received”标签中发送站点域名和IP均不相似,则被视为路由信息中断;l A3:“Received”项中各个域名与其IP不匹配次数;l A4:“Received”中发送站点项缺少域名次数;l A5:“Received”中by项缺少域名次数;l A6:“Received”中from项缺少IP次数
16、;l A7:“From”中原始发送地址与“Received”中原始发送地址与否一致;l A8:“To”中目地址与“Received”中实际收信人地址与否一致;l A9:“Delivered-To”项和“To”项与否一致;l A10:“Return_Path”项和“From”项与否一致;l A11:一定期间段内邮件发送服务器一次发送顾客数;l A12:邮件头“Subject”字段包括垃圾特性信息;输出:垃圾邮件鉴定成果(0:pending; 1:spam);3.1.6 规则过滤输入:完整邮件信息(包括邮件头和邮件体)加工:采用多模式匹配算法,根据预设规则对邮件内容进行模式匹配,依照综合评提成果鉴
17、定邮件与否是垃圾邮件。需求规定:支持规则规模以上,支持垃圾邮件模糊辨认,支持顾客自定义垃圾邮件阻断、隔离敏感度。输出:垃圾邮件鉴定成果(0:pending; 1:spam);3.1.7 记录分析输入:完整邮件信息(包括邮件头和邮件体)加工:采用基于bayes算法记录过滤模型,对对邮件内容进行分词记录,根据计算成果鉴定邮件与否为垃圾邮件。需求规定:系统支持汉语文本词语切分;具备学习功能。输出:垃圾邮件鉴定成果(0:pending; 1:spam);3.1.8 查毒引擎输入:完整邮件信息(包括邮件头和邮件体)加工:采用calm av病毒引擎对包括附件在内完整邮件进行病毒检测,过滤出包括病毒垃圾邮件
18、。输出:垃圾邮件鉴定成果(0:ham; 1:spam; 2:pending);3.2对性能规定3.2.1精度该软件系统性能精度规定如下: 基于规则评分系统支持规则规模以上; 基于规则评分系统,垃圾邮件发现辨认漏报率低于5、误报率低于2; Bayes过滤器过滤垃圾邮件精确率达到99%; 支持Unicode、ASCII、GB2312、GBK、GB18030、UTF-8等各种字符编码方式; 单机解决能力达到100Mbps;3.2.2时间特性规定该软件系统时间特性规定规定如下: 系统响应时间:实时响应; 每封邮件规则过滤时间不大于20ms(邮件大小8K,规则数); 每封邮件记录过滤时间不大于200ms
19、(邮件大小8K,规则数);3.3数据管理能力规定本软件系统需要管理数据记录涉及: 系统配备文献; 系统规则库(支持10,000条以上数据纪录); 系统单词表(支持10,000条以上数据纪录); 垃圾邮件数据库(单表支持40G数据容量);数据增长阐明:本系统垃圾邮件数据库应能提供每日一表功能,支持顾客设定纪录保存时间,以循环使用外存容量保存历史垃圾邮件纪录。3.4故障解决规定本软件系统遇到软件故障时应可以纪录故障因素,并自动恢复运营;遇到硬件故障时,当故障排除,系统应可以自动恢复运营。4运营环境规定4.1设备运营该软件所需要硬件设备为一台IBM兼容机(或1U服务器),配备阐明如下: 解决器型号:
20、P4 2.0G1;内存容量:1G1 外存容量:IDE硬盘(40G1); 输入设备:键盘或通过Web方式远程输入;输出设备:显示屏或Web浏览器; 数据通信设备:10-100M自适应网卡2;4.2支持软件本系统运营所需支持软件阐明如下:列出支持软件,涉及要用到操作系统、编译(或汇编)程序、测试支持软件等。 操作系统:linux系统(内核版本:2.4.30),以redhat 9为开发测试平台,不排斥其她linux系统,但也不专门为其她系统作优化或开发。 编译程序:GCC 3.2.0以上版本;J2SDK 1.4以上版本; 测试支持软件涉及:Berkeley DB;Webmin;Apache + Tomcat;4.3接口本软件系统可独立运营,但提供接受垃圾邮件阻断规则原则接口。所采用数据通信合同遵循电子科技大学新型计算机应用技术重点实验室提出垃圾邮件阻断规则原则接口草案。4.4控制本软件系统安装配备工作采用普通键盘和显示屏作为原则输入输出工具,完毕系统安装和基本配备工作后,重启或关机后上电即可自动运营,正常使用不再需要人为控制。对于运营中系统进行系统管理、性能调优和参数修改等工作,可以通过远程桌面客户端或Web浏览器等两种方式远程访问本系统,通过输入合法顾客名和密码获取不同限度系统控制权限,从而实现对系统远程安全访问和设立。
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100