1、华南理工大学本科毕业设计开题汇报一、 选题背景及意义 近四十年来,传统确实定性数据( deterministic data)管理技术得到了极大发 展,造就了一个数百亿数据库产业。数据库技术和系统已经成为信息化社会基 础设施建设关键支撑。在传统数据库应用中,数据存在性和正确性均确定 无疑。多年来,伴随技术进步和大家对数据采集和处理技术了解不停深入, 不确定性数据( uncertain data)得到了广泛重视。在很多现实应用中,比如 经济、军事、物流、金融、电信等领域,数据不确定性普遍存在,不确定性数 据饰演着关键角色。传统数据管理技术却无法有效管理不确定性数据,这就引 发了学术界和工业界对研发
2、新型不确定性数据管理技术爱好。因为不确定性数据产生原因比较复杂(可能是原始数据本身不正确或是采 用了粗粒度数据集合,也可能是为了满足特殊应用目标或是在处理缺失值、数 据集成过程中而产生),所以,不确定性数据种类较多,比如关系型数据、半 结构化数据、流数据、移动对象数据等,对应地也出现了很多和数据类型紧密相 关数据模型。定义和应用场景相匹配数据模型是不确定性数据管理首要任务. 在不确 定性数据管理领域,最常见模型是可能世界模型(possibleworld model)。该模型 从一个不确定性数据库演化出很多确定数据库实例(称为可能世界实例),而且 全部实例概率之和为 1. 不确定性数据种类较多,
3、比如关系型数据、半结构化 数据、流数据、移动对象数据等,尽管存在很多和数据类型紧密相关数据模型, 不过这些模型最终全部能够转化为可能世界模型. 其中,基于 xml 不确定性数据建模研究对象关键是半结构化数据模型。半结构化数据模型( semistructured data model)能有效描述缺乏严格模式结构 数据。半结构化数据通常能够用文档树来描述。Dekhtyar 等人提出了一个管理 概率半结构化数据(probabilistic semistructured data)方法,该方法以关系数据库 技术为基础,支持丰富代数查询。更多工作则是直接以文档树形式描述不确 定性半结构化数据,比如p2
4、文档模型( p2document model)、概率树模型,和 PXML 模型 、Keulen 等人概率树模型、PrXML 模型等。二、 工作任务分析 我在小组中研究部分是不确定性数据模型。项目开启后,我工作和任 务可分解分以下多个部分 1、学习和整理前辈们在不确定性数据方面研究结果。这项目工作任务关键 分三个阶段进行。第一阶段是广泛地搜集和了解不确定性数据相关知识,了解 不确定性数据轮廓,知道相关术语、概念,方便以后和她人作相关交流。第二阶段是有针对性学习和理整理现有不确定性数据模型方面理论知识。这 一阶段,要知道多种模型概念、所针对不一样种类数据、和它们优势和不足 之处。第三阶段是把精力放
5、在不确定性数据研究某种数据模型上。此阶段要 做到对相关模型在较深入了解,不单要知道她们定义、优劣、具体应用情 况,还要了解它们在数学上表述、证实。2、对现有不确定性数据模型提出自己见解。关键包含以下一系列活动:1)仔细研究现在模型优点和不足之处;2)和其它组员(还有指导老师和相 关研究人员)交流见解,尤其是向其它组员了解在不确定性数据存放和查询 方面算法知识,为优化工作提供依据和灵感。3)整理所搜集到不确定性数据模 型资料。三、 调研汇报 1 不确定性数据和xml 发展史 实际上,针对不确定性数据研究工作已经有几十年历史了。从二十世纪八 十年代末开始,针对概率数据库(probabilistic
6、 database)研究工作就从未间断, 这类研究工作将不确定性引入到关系数据模型中去,取得较大研究进展。多年来, 针对不确定性数据研究工作则在更广范围之内取得更大进展,即:在更丰 富数据类型上处理更多个类查询任务。不确定性数据管理技术经典框架包 含四大部分:模型定义、预处理和集成、存放和索引、查询分析处理。可扩展标识语言XML(eXtensible Markup Language)1是一个简单灵活 文本格式可扩展标识语言,起源于 SGML(Standard Generalized Markup Language),是 SGML 一个子集合,也就是 SGML 一个简化版本,很适合 于在 Web
7、 上或其它多个数据源间进行数据交换。伴随 Web 上数据增多, HTML 缺点越来越突出。W3C 组员认识到,必需有一个方法能够把数据本身 和数据显示分离开来,这么W3C 在1996 年提出了XML 概念。XML 不仅保 留了SGML 很多优点,而且愈加轻易操作和在World Wide Web 环境下实现。1998 年,XML 成了W3C 推荐标准。2 不确定性数据发展方向 在传统数据库应用中,数据存在性和正确性均确凿无疑。多年来,伴随 技术进步和大家对数据采集和处理技术了解不停深入,不确定性数据 (uncertain data)得到广泛重视。在很多现实应用中,比如:经济、军事、 物流、金融、
8、电信等领域,数据不确定性普遍存在,不确定性数据饰演关键角 色。传统数据管理技术却无法有效管理不确定性数据,这就引发了学术界和工 业界对研发新型不确定性数据管理技术爱好。针对不确定性数据研究工作 则在更广范围之内取得更大进展,即:在更丰富数据类型上处理更多个类 查询任务。四、 方案确定和分析 1、采取由大到小,由浅入深次序进行研究。不确定性数据对于我来说,是比较新东西。要想快速把握一样新东西, 并不停深入,从整体上了解它整个框架,是很关键。这么能够预防在研究 过程中迷失方向,同时,从整体上把握了不确定性数据后,也能够更方便更有效 率地和她人进行交流,更有效地从网络上检索到有用信息。万丈高楼平地起
9、,把握不确定性数据整体,就是为不确定性数据模型研 究打基础。基础扎实,深入研究阶段才能底气。五、 毕业论文撰写提要 摘要Abstract 第一章 绪论 1.1 不确定性数据背景 1.2 不确定性数据管理框架 1.2.1 模型定义 1.2.2 预处理和集成 1.2.3 存放和索引 1.2.4 查询分析处理 1.3 不确定性数据模型 1.4 建模要求和挑战 1.4.1 庞大可能世界实例集合 1.4.2 新出现维度概率维 1.4.3 不确定性数据管理理论问题 第二章 可能世界模型 2.1 可能世界模型介绍 2.2 可能世界模型举例和说明 第三章 针对关系型数据模型 3.1 Probabilistic
10、 ?-table 模型 3.2 Probabilistic or-set table 模型 3.3 Probabilistic or-set-?Table 模型 3.4 Probabilistic c-table 模型 3.4.1 三个简单表示系统 3.4.2 Probabilistic c-table 第四章 针对半结构化数据模型 4.1 p-document 模型 4.1.1 模型介绍 4.1.2 xml 4.1.3 模型定义相关问题和处理方法 4.2 概率树模型模型(probabilistic tree model 4.2.1 模型快照 4.2.2 模型定义 4.2.3 模型不足之处 4
11、.3 PXDB 模型 4.3.1 PXDB 模型引入 4.3.2 模型定义 4.3.3 c-formulae 4.3.4 模型评价 第五章 其它模型 5.1 针对数据流模型 5.1.1 针对数据流模型 5.1.2 一个常见模型定义 5.1.3 相关窗口分类 5.2 针对多维数据模型 5.2.1 相关OLAP 5.2.2 针对多维数据模型 5.2.3 相关模型 第六章 总结 6.1 内容总结 6.2 展望 参考文件 致谢 六、 实施计划 设计总共用时3 个半月左右。具体安排以下:.3.1.4.11 论文选题,搜集资料,并完成开题汇报初稿。.4.12.4.30 学习和整理不确定性数据相关资料。.5
12、.1.5.15 进入不确定性数据模型深入研究阶段,并完成论文初 稿。.5.16.5.25 修改毕业论文 .5.26.6.10 整理好材料,装订好论文,进行答辩准备。指导老师意见:签 名:年 月 日 备注:1、要有10 篇以上相关文章阅读量。2、理、工科开题汇报撰写不少于2500 字,人文社科开题汇报不少于3500 字,包含论文选题 背景和意义、工作任务分析、调研汇报、方案确定和分析、毕业论文撰写提要及实施计 划、文件综述(理、工科可不提交文件综述)等。3、电脑打印,用 A4 纸,页边距左边 3。2cm,右边 2。54cm,上下边距 2。54cm,在左边装 订;内容为小四号宋体,行距为固定值20 磅。4、文件综述(按文件综述格式打印)附在开题汇报后面一起装订。
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100