1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,#,信息技术基础设施与数据管理,汪云峰 城市管理与城市信息化研究所,信息技术基础设施,2,信息技术基础设施的演进,会计电算机,:,1930-1950,通用主机和小型机,:,1959-,个人计算机,:,1981-,客户机,/,服务器:,1983-,企业互联网计算:,1992-,多层客户机,/,服务器网络,基础设施演化的技术驱动力,摩尔定律和微处理能力,大规模数据存储定
2、律,通信成本递减与互联网,摩尔定律和微处理能力,芯片成本的下降,硬盘驱动器指数性地增长,,1980-2004,存储数据的成本指数下降,互联网通信成本的指数下降,技术设施产业,数据管理,数据库:一组相关的文件,文件:一组同一类型的记录,记录:一组相关的字段,字段:一组字,可以命名的最小信息单位,字(,Word,):一组字节,字节:,8,个二进制位,位:计算机能处理的最小数据单位,数据层级,实体:客观存在而且可以相互区别的人、地点、物品、事件等。,属性:对实体特性的描述。,关键字段:用来唯一标识该记录的字段。,实体与属性,传统文件处理过程,传统文件环境中的数据组织,传统文件环境下的数据组织,传统文
3、件环境存在的问题,数据冗余与不一致,数据冗余:同样的数据在多个地点存放,数据不一致:同一个属性有不同的值,传统文件环境下的数据组织,数据,程序依赖,数据依赖特定的程序,如果程序改变了,数据也要随之改变才可使用。,缺乏灵活性,能够完成常规的报告,但是不支持定制的需求和未预料到的需求。,传统文件环境下的数据组织,低安全性,对于数据少有控制和管理,不知道谁能够读取以及修改数据。,缺乏共享,信息分散在组织各处。,当代的数据库环境,数据管理的数据库方式,数据管理的数据库方式,数据库管理系统,使组织能够合理管理整个组织的数据,作为应用程序和数据物理文件之间的接口,将数据的逻辑视图和设计视图分开,解决传统数
4、据文件方式的许多问题,数据管理的数据库方式,关系型数据管理系统,将数据组织为二维表,即关系。,在通用的数据元素素基础上将数据关联起来。,如,DB2,Oracle,MS SQL Server,关系型数据模型,关系型数据管理系统的基本操作,尚未规范化的关系,创造数据库环境:实体关系图,创造数据库环境:规范化关系,创造数据库环境:确保数据质量,决策的质量直接与数据库中数据的质量相关。,政府和企业的数据库的数据质量水平低于预期。,国家消费者信用数据库的数据错误率为,20-35%,32%,的美国,FBI,计算机化的犯罪记录存在不准确、不完整和荒谬之处。,Gartner,集团估计企业数据质量以每月,2%,
5、的速度在下降。,创造数据库环境:确保数据质量,数据质量审计:在信息系统中系统地调查数据的准确和完整程度。,数据清理:发现和改正数据库中存在的不正确、不完整、不规范以及冗余的现象。,谢谢参与!,32,33,34,全电子真空管计算机:,UNIVAC,35,UNIVAC,36,晶体管计算机:,1401,37,1401,38,晶体管计算机:,7090,39,7090,40,通用商业主机:,IBM360,41,IBM360,42,小型机:,DEC-PDP-11,43,PDP-11,44,小型机:,DEC-VAX,45,VAX,46,Xerox-Alto,47,Alto,48,MIT-Altair,49,Altair,50,Apple I,51,Apple I,52,Apple II,53,Apple II,54,