1、软件工程论文开题报告模板 开题的综述部分应首先提出选题,并简明扼要地说明该选题的目的、相关课题研究情况、理论适用、研究方法,以下是一篇关于软件工程论文开题报告的模板,希望对大家有帮助。 当今的互联网效劳面临着许许多多的挑战和千变万化的需求,其中就包括需要管理海量的数据,并且能为高速增长的用户群提供持续可依赖的效劳。这里所说的互联网效劳包括了诸如在线邮箱、搜索引擎、在线游戏、在线金融系统、内容分发网络、文件共享网络等等。因此,能提供这些互联网效劳的系统往往很庞大:由成百上千台机器组成,并且这些机器可能在同一个数据中心里,也可能分散在不同的数据中心,之间通过不可依赖的网络进展通信。在具有如此宏大的
2、扩展性的集群中,错误的发生变的很常见:一部分机器可能随时会遇到硬件或者软件故障;网络延迟和网络故障随时可能发生,导致丢包、网络分区等情况;偶发的恶意攻击或是操作错误,也有可能导致不可预测的灾难性错误发生。所以,构建这种系统的软件往往很复杂,同时,每隔一段时间,系统都需要进展一定的修改(升级)以提升性能、修改错误或增加新的功能。本文工作所面临的最根本的问题就是如何有效地设计一种工程上可行的升级方案,使得这种规模的分布式系统能在升级期间能持续地提供效劳。 时下云计算十分火爆,各种互联网公司、银行、政府都经常提及云计算,各种各样的分布式系统也层出不穷,不管是著名的大型分布式产品的开源工程诸如Hado
3、op、OpenStack、MongoDB等等,又或者是国内外的著名的云计算效劳提供商AmazonAWS、MicrosoftAzure、阿里云们,云计算早已从纸面或者是宣传标语中,走向了实实在在的落地阶段。但是,针对云计算抑或是分布式系统中一个比较详细的问题的相关研究,尤其对于国内的相关领域而言,却是比较缺少的,国内工业界的著名厂商们似乎都在闷头造车,分享出来的解决云计算工程中实际详细问题的论文和研究成果依然较少。本人深知自己的能力有限,仅得益于研究生期间的一些实习经历,结合工程实际,尝试对分布式系统的升级和数据迁移问题做一些和提炼的工作,并且有一定的创新。 分布式系统是其组件分布在联网的计算机
4、上,组件之间通过传递消息进展通信和动作协调的软件系统。分布式系统是一个统称,常见的有分布式操作系统、分布式程序设计语言及其编译(解释)系统、分布式文件系统和分布式数据库(存储)系统等等。本文所面临的升级和数据迁移的问题涉及到更多的是分布式存储系统,分布式存储系统的定义如下:分布式存储系统是大量的普通的PC效劳器通过互联网互联,对外作为一个整体提供存储效劳。 也可以说,那些以数据存储和访问为目的而设计的分布式系统称之为分布式存储系统。与普通的软件系统不同,分布式存储系统具有以下几个特性,理解这些特性对解决本文所提出的问题具有根底性的意义。扩展性:分布式存储系统的扩展性是最重要的优势,往往可以扩展
5、成百上千台的规模。同时随着集群规模的增长,其系统整体性能表现为线性增长。 并且,可以根据一定的策略将数据和请求分配到不同的物理节点,物理节点的数目和集群处理能力成正比,集群是线性可扩展的。同时,集群能否扩展,可否线性扩展是衡量分布式存储系统的一个重要指标。低本钱和高性能:分布式存储系统具有的自动容错、自动负载均衡机制使其可以构建在普通的PC机之上。另外,线性扩展能力也使得增加、减少机器非常方便,可以实现自动运维。因此,对整个集群而言,分布式存储系统具备高性能。 数据分布:分布式存储系统区别于单机存储系统最大的特点是它可以按照一定方法进展数据切片,不同的物理节点分布不同的数据分片,从而将系统的存
6、储容量压力和访问请求压力分散到系统集群的各个物理节点上,使系统整体能够存储超大规模的数据量,同时能够承受更多的并发请求。 那么如何将数据分布到多台效劳器才能够保证数据分布均匀?数据分布到多台效劳器后如何实现跨效劳器读写操作?常用的数据分片和分布方法有两种:a.哈希分区方法,即根据数据的Key进展哈希取模,离散的分配到集群的物理节点上,Amazon的Dynamo采用了一致性哈希算法进展分区;b.连续分区方法,即将整个数据集合按照key来排序,根据key的范围进展分片。 四、本文研究的主要内容及研究框架 本论文共分为六章,各章的主要内容如下所述: 第一章为引言。介绍了本论文的研究背景,简述了云计算
7、和分布式系统目前的现状,系统升级的必要性,以及本文的主要工作和组织构造。 第二章为文献综述。介绍了分布式系统相关的根本理论,分析了一些典型的Nosql系统,综述了在单机软件成熟的升级方案以及在分布式系统升级问题上前人的一些研究成果。 第三章为难点分析及总体设计。本章系统地分析了分布式系统升级问题的难点,并且提出了高可用的分布式系统升级设计的根本概念和原那么,在此根底上,提出了该问题的总体设计方案。 第四章为详细设计和实现。本章在前一章的根底上,依次详细地设计了在单数据中心和跨数据中心的分布式环境下的系统升级方案,为本论文的最为重点的章节。 第五章为方案测试与实施。本章在详细设计与实现的根底上,
8、提出了相应的测试和实施方案,通过测试分析和实验分析验证了升级方案的有效性。 第六章为总结和展望。总结了全文所做的工作,指出了论文的创新点,并且对论文的缺乏以及未来的后续研究做出了展望。 (二)本文研究框架 本文研究框架可简单表示为: 摘要4-5 ABSTRACT5-6 第一章引言9-11 1.1研究背景9 1.3本文组织构造10-11 2.1分布式相关理论11-14 2.1.1根本概念和特性11-12 2.2典型Nosql系统分析14-19 2.2.1Bigtable15-16 2.2.2Dynamo16-18 2.2.3Cassandra与Bigtable,Dynamo的比照18-19 2.
9、5本章小结22-23 第三章难点分析与总体设计23-32 3.2高可用的分布式系统升级设计25-27 3.2.2升级设计的根本原那么26-27 3.3总体设计方案27-31 3.3.2方案步骤28-30 3.3.3重点说明30-31 3.4本章小结31-32 第四章详细设计与实现32-51 4.2单数据中心分布式系统升级33-38 4.2.1设计意义33-34 4.2.2详细设计34-38 4.3跨数据中心分布式系统升级38-42 4.3.1区别分析38 4.3.2总体说明38-39 4.3.3读写请求处理39-40 4.3.4详细步骤40-42 4.4主要模块的实现42-49 4.4.2升级主要模块实现44-46 4.4.3数据迁移模块实现46-48 4.4.4回调函数的实现48-49 4.5本章小结49-51 第五章方案实施与测试51-70 5.1方案实施51-57 5.1.1系统部署51 5.2方案测试57-66 5.2.1单元测试57-61 5.2.2集成测试61-63 5.2.3系统测试63-66 5.3实际生产环境测试结果66-69 5.4本章小结69-70 第六章总结与展望70-72 6.1回忆和总结70-71 6.2前景展望71-72 参考文献72-74