资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/10,#,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,阿里云计算交流,提纲,淘宝技术架构发展历程,阿里云产品及技术介绍,参考案例,上云方案,淘宝网站发展历程,V1.1,V1.0,V2.0,V3.0,2010,年:,交易额,4000,亿,注册用户,4,亿,卖出,2.7,亿件服饰,卖出,5000,万部手机,2003.5 2004.1,非典时期,phpAuction,LAMP,MySQL,读写分离,Slave1,Slave2,MySQL,Master,复制,复制,Read,Read,Read/Write,Apache,mod_php4,pear DB,App,Apache,mod_php4,pear DB,App,3,Apache,mod_php4,pear DB,App,2,Apache,mod_php4,pear DB,App1,前期技术发展,一切从简,快速上线,2004.1 2004.5,MySQL,迁移至,Oracle,引入,SQL Relay,中间件,Oracle,Apache,mod_php4,pear DB,App,SQL Relay,Apache,mod_php4,pear DB,App,3,SQL Relay,Apache,mod_php4,pear DB,App,2,SQL Relay,Apache,mod_php4,pear DB,App,1,SQL Relay,前期技术发展,DB,升级,提高稳定性,2004.6 2006.10,Java,代替,PHP,拥抱开源产品,基于,ISearch,的搜索,自建,CDN,简单快捷,需求为王,cache,Read/Write,Read/Write,dump,Search,Node1,Node2,Noden,Oracle,Oracle,Oracle,Oracle,JBoss,淘宝,MVC,Spring,Ibatis,JBoss,Webx,Spring,App,3,Ibatis,JBoss,Webx,Spring,App,2,Ibatis,JBoss,Webx,Spring,App,1,Ibatis,2006.10 2007.10,分布式缓存,TDBM,分布式存储,TFS,分布式搜索引擎,Oracle,Oracle,Oracle,Oracle,Read/Write,Search,Node1,Node2,Noden,Node1,Node2,Noden,JBoss,淘宝,MVC,Spring,Ibatis,JBoss,Webx,Spring,App,3,Ibatis,JBoss,Webx,Spring,App,2,Ibatis,JBoss,Webx,Spring,App,1,OR-Mapping,cache,分布式存储,Node1,Node2,Noden,前期技术发展,问题,I,上百人维护一个代码百万行的核心工程,工程太大,开发效率低,需求响应慢,相互影响,火车模型发布,相互影响常见,故障不能隔离,代码复杂难维护,问题,II,所有系统都要关心数据拆分规则,不必要的设计,数据库连接达到上限(每个,Oracle,数据库大约提供,5000,个链接),连接池是有限的资源,Oracle,数据库,太多的应用机器,有限的链接池,需要数据库连接,应对策略,垂直拆分系统,用户中心,(UIC),,第一个业务中心在,2008,年初上线,千岛湖项目,交易中心,(TC),,类目属性中心,(Forest),五彩石项目,店铺中心,(SC),,商品中心,(IC),,评价中心,(RC),拆分数据库,垂直拆分,水平拆分,组织结构支持,中间件,团队,服务中心团队,垂直产品团队,用户,中心,交易,中心,商品,中心,技术发展,业务中心的模式,Center,,,20,个核心服务中心系统,前端页面应用,上千个应用系统,基础中间件,HSF,:远程,RPC,中间件。,Notify,:消息中间件。,TDDL,:分布式数据库访问中间件。,ConfigServer,:配置推送中间件。,哈勃:运行数据收集,展现,监控,报警等,。,分布式中心系统,Oracle,Oracle,Oracle,Oracle,JBoss,淘宝,MVC,Spring,Ibatis,JBoss,Webx,Spring,App,3,Ibatis,JBoss,Webx,Spring,App,2,HSF,JBoss,Webx,Spring,App,1,HSF,业务中心,用户中心,商品中心,ConfigServer,Tair/TFS/Search,Notify,HSF,TDDL,交易中心,HSF(,高性能服务框架,),高性能服务框架,High-Speed Service Framework,(,HSF,),用以在两个应用系统之间进行远程调用,远程访问对应用透明,一些数据,每天,1000,亿的请求,部署,HSF,服务器总数,:近,60000,台,App1,App,交易中心,App1,App,Notify,消息系统,付款,付款消息,App1,App,收费系统,App1,App,交易:扣积分,App1,App,物流:创建物流订单,交易系统使用,Notify,的案例,系统消息通知,用户,马上返回,继续操作,4,1,2,3,Notify,系统,分布式消息通知系统,通过消息将业务系统解耦,持久化消息,,100%,可靠,支持集群订阅,支持事务消息,一些数据,200,亿条消息每天,600,亿投递量,数据层领域,淘宝分布式数据访问层中间件,进行,SQL,解析,获取路由字段,对应用完全透明,单库和多库多表代码一样,支持基于,SQL,级别的数据复制,支持,Oracle,到,MySQL,的数据复制,应用场景,用户、商品、交易等多个系统,Oracle,,,MySQL,集群,超过,3000,台,MySQL,集群,ESC,MQS,CDN,OCS,OSS,TASK,运行容器,服务管理,消息服务,分布式数据层,负载均衡,数据搜索服务,配置服务,数据同步服务,数据分析服务,商品服务,交易服务,店铺服务,会员服务,营销服务,物流服务,分账服务,交易服务,店铺服务,营销服务,物流服务,分账服务,数据回流自循环,淘宝账号登陆,APP,孵化工厂,日志,服务,统计,服务,监控,服务,访问控制服务,身份,服务,TOP,阿里云,中间件服务,支撑体系,聚石塔,U,站,爱淘,宝,特色中国,微淘开放,库存同步,卖家营销,订单管理,消费者业务,商家业务,共享业务,应用安全体系,数据安全体系,前端,安全体系,开发者工具链,淘宝的参考架构,提纲,淘宝技术架构发展历程,阿里云产品及技术介绍,参考案例,上云方案,传统的数据中心,VS,阿里,云,交付方式,:根据预计的峰值软硬件需求一次性采购软件,+,硬件,系统集成后由客户,/,合作伙伴维护,关注产品参数,Linux,集群,资源管理,(伏羲),安全管理,(钟馗),远程过程调用(夸父),分布协同服务(女娲),(大禹)集群布署,(神农)集群监控,分布式文件系统(盘古),任务调度(伏羲),云服务引擎,ACE,弹性计算,服务,ECS,关系型数,据库服务,RDS,开放存储,服务,OSS,开放结构化,数据服务,OTS,开放数据,处理服务,ODPS,数据,中心(,x86 Server,),交付方式,:,以服务的方式,提供,,共同,运维,关注服务,SLA,阿里云,IOE,等,阿里云计算,服务,是,以,自,有,核心,技术,为基础的平台服务,Linux,集群,资源管理,(伏羲),安全管理,(钟馗),远程过程调用(夸父),分布协同服务(女娲),(大禹)集群布署,(神农)集群监控,分布式文件系统(盘古),任务调度(伏羲),云服务引擎,ACE,弹性计算,服务,ECS,关系型数,据库服务,RDS,开放存储,服务,OSS,开放结构化,数据服务,OTS,开放数据,处理服务,ODPS,数据中心,ODPS,ECS,:,云服务器,SLB,:负载均衡,ODPS,:,大规模数据处理服务,RDS,:,关系数据库服务,OSS,:存储服务,OTS,:,结构化数据,服务,OCS,:缓存服务,CDN,:内容分发网络,ECS,SLB,RDS,OSS,OTS,OCS,CDN,云盾,云盾:,安全体检、安全管家,云监控:,8,种站点可用性监控、,14,种服务器监控,云监控,ACE,ACE,:弹性计算引擎,阿里云计算为中国第一大云计算平台,也是最安全高速的云计算,平台,.,云计算产品服务完全基于自主,知识产权,先后获,85,项国家技术专利,获得国家发改委的云计算专项资金,支持,飞天平台单集群规模已达,5000,台,不断丰富的云服务,满足各种场景下的,IT,需求,2014.2,2014.5,2014.7,2014.1,2014.8,2014.9,2014.10,2014.11,负载均衡,SLB,开放缓存,服务,OCS,2014.12,2014.3,开放数据处理,服务,ODPS,内容分,发网络,CDN,简单,日志,服务,SLS,数据,备份服务,OAS,开放结构化数据服务,OTS,虚拟私有云,VPC,,,EIP,全新,的,API,以及权限体系,让开发者能够自己定制管理监控需求,或是利用,API,开发第三方工具提供给其他开发者使用。,2,月底开始到,3,月底,全新改版的管理控制台以及新的移动客户端上线,,供用户实时,监看云资源的状态。,Q1,底,,RDS,会有单独的,DB,管理工具,。,机房,的节点,除了现有的杭州及青岛节点,,计划,在,Q2,推出北京以及香港节点(满足国际化的应用)。下半年还会陆续开放南方节点。,云,磁盘,Cloud Disk,2014.4,2014.6,流,计算服务,OSPS,分布式关系数据库服务,DRDS,虚机自动扩展,服务,ElasticScaling,计算服务,DIKU,视频服务,MQS,阿里云服务实现高可用,Storage Tiering,分布式存储系统大大提高了数据的可靠性,,单,份数据损坏对云服务器使用没任何,影响,,后台系统会自动拷贝,使数据始终保证三重备份。数据可靠性,可,99.999,%,。,分布式存储,通过,磁盘快照可以在磁盘数据发生问题后恢复到快照时间点,从而有效保护了弹性磁盘的文件系统和数据,。,快照备份,云,服务器发生故障时可快速恢复,故障恢复时间非常短,。,即时,恢复,当宿主物理机发生故障时,平台能够自动迁移云服务器,并且将其数据恢复到最后一刻的状态,。应用,完全不中断,用户完全无感知。通过在线迁移可以根据物理机负载情况调度,资源,。,在线迁移,以,ECS,为例,:,SLB,两地三中心,RDS,Standby,备份,E,CS,实例:应用服务器,RDS Master,同步,专享集群,双中心,应用容灾,异地,容灾,RDS,Standby,核心,数据同步,支持两地三中心容灾,负载均衡:,SLB,提供,DNS,域名解析,及流量负载,均衡,数据库,层:,RDS,的,MySQL,数据库创建一个高可用,架构,数据库备份在,OSS,分布式对象存储中,应用服务层:,运行在,ECS,实例上的应用服务器集群,可灵活,扩展,日志和快照存储在,OSS,中,Web,服务层:,运行在,ECS,实例上,的,Web,服务器,集群,可灵活,扩展,,日志和快照存储在,OSS,中,E,CS,实例:,Web,服务器,E,CS,实例:,Web,服务器,E,CS,实例:应用服务器,日志,&,快照,日志,&,快照,E,CS,实例:应用服务器,E,CS,实例:,Web,服务器,日志,&,快照,日志,&,快照,Region,Global,Region,复制,阿里,云,统一云管理,平台架构图,云资源池,云资源池(北京),移动设备门户,PC,门户,管理控制台,云接入,API,服务,计费、成本分摊和能力规划,策略管理(,SLA,管理,,DRS,DPM,,,Identity,),云服务监视,供应,配置管理,自助服务供应,软件库,组装工具,统一云管理平台,资源监控,资源,开通与部署,云管理层,ECS,弹性,计算服务,OSS,开放存储服务,x86 Server,x86 Server,ODPS,开放数据平台服务,x,86 Server,ECS,弹性,计算服务,OSS,开放存储服务,RDS,关系数据服务,x86 Server,x86 Server,ODPS,开放数据平台服务,x,86 Server,x,86 Server,ECS,弹性,计算服务,OSS,开放存储服务,RDS,关系数据服务,x86 Server,x86 Server,ODPS,开放数据平台服务,x,86 Server,x,86 Server,云资源池,(上海),云资源池,(广州),API,服务,API,服务,云,服务器:,ECS,通过,云服务器向用户提供服务,云服务器就是,ECS,平台提供的虚拟机实例,ECS,云服务器,API,Remote Desktop,SSH,使用,云服务器与传统托管物理服务器使用方法完全相同,用户对云服务器有完全控制权,可通过远程的方式或,API,的,方式来,对云服务器进行一系列基本操作。,云服务器的计算能力可用虚拟,CPU,,虚拟,MEM,来表示;磁盘存储能力可用云磁盘容量来衡量。区别于传统服务器,云服务器具有较为灵活的机器配置。,用户可以根据需求灵活配置云服务器,在服务器运行过程中,如果现有服务器配置不能满足业务需求,可随时调整服务器配置,。,ECS,系统架构,飞天核心平台,API,运维监控模块,性能监控,资源监控,网络监控,数据采集,资源调度,虚机管理,安全控制,虚拟化平台,计算,资源,分布式存储系统,控制系统,ECS,平台包含四大组成部分,分别是虚拟化平台、控制系统、运维监控模块以及对外,API,接口。,例如:,ECS API,接口体系,API,接口体系,实例接口,创建,启动,停止,重启,重置,修改,查询,删除,磁盘接口,新增磁盘,删除磁盘,查询磁盘,快照接口,创建快照,删除快照,查询快照,快照回滚,镜像接口,查询镜像,创建镜像,删除镜像,网络接口,分配公网,IP,释放公网,IP,安全组接口,创建安全组,授权安全权限,查询安全规章,查询安全组列表,撤销安全组规则,删除安全组,数据中心接口,撤销可用数据中,查询,Zone,信息,监控接口,云服务器监控,其他接口,查询实例资源规格列表,磁盘快照:提供基于时间点的磁盘备份和恢复,分布式存储,OSS,T0,T1,T2,T3,TimeLine,云服务器,vdisk,快照,1,快照,2,vdisk,快照,0,Client,创建快照,回滚,New vdisk,Client,创建快照,Client,磁盘快照是磁盘在某一特定时间点的副本,是保留和恢复磁盘数据非常有效的方法之一,。,通过,磁盘快照可以在磁盘数据发生问题后恢复到快照时间点,从而有效保护了磁盘的文件系统和数据,。,在,升级应用和服务器及打补丁的时候,快照可以发挥非常关键的,作用,。,数据回滚:,1.,分配新磁盘,可用大小与原磁盘相同;,2.,复制,快照,0,数据到新磁盘;,3.,将新磁盘替换原磁盘。,自定义镜像:实现云服务器的快速部署,分布式存储,OSS,快照,1,快照,0,镜像,0,2.,创建镜像,云服务器,1.,创建快照,3,.,创建云服务器,高配置,中配置,低,配置,4.,安装,LAMP,环境,5.,创建新快照,6.,创建镜像,镜像,1,7.,创建云服务器,镜像是启动云服务器的基础。镜像即一块母盘,包含操作系统以及应用软件配置,创建云服务器必须基于一个镜像,创建成功后,,系,统盘内容即为此镜像的完全,克隆,。,自定义镜像指用户可以将现有云服务器系统盘保存为一个镜像,并可以此镜像作为一个模板,快速创建与已有云服务器,系统,配置,完全,相同的机器。,阿里,云提供的热门镜像,M,M,M,Paxos,CS,CS,CS,CS,CS,女娲,LockService,KVServer,KVServer,KVServer,KVMaster,WS+PM,WS+PM,WS+PM,WS+PM,协议接入层,数据访问层,持久存储层,Request,ACK,开放存储服务,(OSS)-,架构,产品功能总览,管理功能,支持,Web,和,API,的管理,支持,Web/API,对,Bucket/Object 管理,文件组功能(,Object Group,),文件访问,支持,RESTFUL API,、,SDK,等方式访问,大文件,分块,上传(,Multi-Part Upload,),访问时支持,If-Modified-Since,和,If-Match,等,HTTP,参数,安全功能,访问控制,(用户签名认证),服务器端加密,存储,访问日志记录,安全控制,Bucket,权限,控制,OSS,提供,Bucket,级别的权限控制,目前每个,Bucket,可以指定为,public-read,权限(即所有人可以读取该,Bucket,)、,public-read-write,(即所有人可以读写该,Bucket,)、,private,(即只有,Bucket,的创建者可以访问该,Bucket,)。,Access ID,和请求,签名,在,存取访问控制上,用户可以创建多个访问,OSS,的,Access ID/Key Secret,对来控制对存储数据的访问。,AccessKey,是访问的用户标识,,Key Secret,用来做数字签名。当用户想以个人身份向,OSS,发送请求时,需要首先将请求内容按照,OSS,指定的格式生成签名字符串,,OSS,会验证签名的有效性放在恶意的攻击,。,防盗链,由于,OSS,提供的是,Http,的收费访问服务,为了防止用户在,OSS,上的数据被其他人盗链,,OSS,支持基于,HTTP header,中表头字段,referer,的防盗链方法。目前,只有通过,OSS,的控制台(,)可以对一个,Bucket,设置,referer,字段的白名单和是否允许,referer,字段为空的请求访问,。,服务器,端,加密,OSS,支持在服务器端对用户上传的数据进行加密编码(,Server-Side Encryption,):用户上传数据时,,OSS,对收到的用户数据进行加密编码,然后再将编码得到的数据永久保存下来;用户下载时,,OSS,自动对保存的编码数据进行解码并把原始数据返回给用户,并在返回的,HTTP,请求,Header,中声明该数据进行了服务器端加密编码,。,安全控制,1,2,3,4,例如,:OSS API,接口,Service,操作,Get Service,Bucket,操作,Get Bucket,Put Bucket,Head Bucket,Delete Bucket,Object,操作,Get Object,Put Object,Post Object,Head Object,Delete Object,Multipart Upload,操作,Initiate Multipart Upload,Upload Part,Complete Multipart Upload,Abort Multipart Upload,List Multipart Upload,RDS,整体架构图,本系统主要包括五大核心组件,它们是:,任务,调度系统,备份系统,高可用控制系统,在线迁移系统,监控系统,除了五大核心组件,系统还采用,LVS(Linux Virtual Server),作为前端访问的第一层,他承载着,IP,映射,端口转发,防火墙,流量控制等功能。,LVS,每个服务支持,5000 VIP,调度能力;单个应用最大支持,1Gb,流量;,HA,节点内部,VIP,切换时间,5,秒。,产品功能总览,工具支撑,DRC,iDB Cloud,愚公,售后服务,5,天无理由退款,7,*,24,小时服务,故障百倍赔偿,备份恢复,自动备份,临时备份,日志管理,数据回溯,购买使用,简单购买,按,量付费,快速升级,安全保障,IP,白名单,防,DDos,SQL,注入告警,数据库升级,数据迁移,实例间复制数据库,数据迁入,/,迁出,备份文件下载,性能调优,慢,SQL,汇总,SQL,报告,性能优化,运维监控,性能监控,SQL,审计,阈值报警,WEB,操作日志,在线注册,用户登录,在线配置,在线支付,自动开通,使用,续费,释放,改配,在线,开通云计算资源服务,安全地,连接云和现有数据中心,云,ECS,实例,VPC Subnet1,ECS,实例,VPC Subnet2,传统数据中心,Gateway,G,ateway,Server,PC,PC,VPN,VPC,联网环境,通过,VPC,将传统数据中心与,海关云实现内网互联,获取并部署基础架构,新的项目总是申请新的设计、设备以及构建环境,.,新的运营的上线环境专门为新的系统服务,硬件占据了大部分时间,不是若干月就是若干周,有时候因为复杂的采购和验收流程会更长,需要必要的设计和开发确定系统大小,因而无法提早下订单,部署和配置软件,新基础架构或者版本需要配置、打包构建以及优化工作,.,专有系统,甚至虚拟化的基础架构发生变更都需要花费时间,因此可用于测试的资源或者对变更需求的响应都是有限的,.,基础架构服务时间,解决方案时间,IT,战略,&,架构选择,获取,&,部署开发的基础架构,部署,&,配置,O/S,、设备、测试环境,设计和开发单元测试,集成,&,测试,获取,&,部署测试基础架构,部署,&,配置,O/S,集成,&,测试环境,新的解决方案需求,获取,&,部署基础架构,部署,&,配置,O/S,设备,以及上线环境,系统上线,获取,&,部署额外的基础架构,部署,&,改变,O/S,设备以及生产环境,新的系统上线,RequirementChange,设计、开发单元测试变更,传统模式下的项目开发,关注业务解决方案,项目团队关注业务的特定需求,.,作为云的客户,团队之需要说明他们的基础架构需求即可,.,虚拟化和标准化服务需求开发人员的纪律性,增加适应性和敏捷性,资源能够按需可用,这,鼓励开发人员创新,,,与用户互动,,以及,快速的扩大测试规模,而无需永久的投资成本,.,动态减少推向市场的时间,从而会把握一些新的机会,在以前,这些机会可能会有比较大的风险,.,IT,战略,&,架构选择,基础架构服务时间仅用若干小时,设计和开发单元测试,集成,&,测试,系统上线,新的系统上线,需求变更,设计、开发单元测试变更,活动的云服务,活动的云服务,活动的云服务,活动的云服务,Cloud,新的解决方案需求,云计算,提升开发云效率,App,Request HW,Request provisioning,Request software,Build application,Request new HW,Request scale-up,数周 到 数月,数周 到 数月,HW locked-up,App,App,创建应用,硬件与平台,平台扩容,独立运行,/,维护,Provision via Self-Service,分钟级,分钟级,Leverage Platform,Build App,Platform supports further apps,Scale-up via Self-Service,App,App,App,创建应用,自服务获得平台,动态伸缩,应用共享平台,更敏捷,更可控,阿里云计算,加快应用,交付,阿里云计算资源池(,SLB,ECS,RDS,OSS,OCS,ODPS,),Exchange,/SQLServer,OA,WebLogic,/Oracle,监控指挥,GreenPlum,缉私管理,WebLogic,/Oracle,关税管理,WebLogic,/Oracle,物流监控,60%,High Cost,Less,Cost,平均资源利用率低于,20%,资源共享提高资源利用率,资源动态分配与调整,保证业务质量(弹性),Failover,Rolling upgrade:,提高系统的可靠性,横向的按业务需要扩展与付费,按峰值性能设计的传统架构,阿里云计算,提升,资源,利用率,部门应用程序,1,服务二,共享服务,共享服务,云监控和管理,共享服务,服务一,感知需求高峰,阿里云计算资源池(,SLB,ECS,RDS,OSS,OCS,ODPS,),计算和数据服务,节点,感知需求高峰,调整容量,调整容量,弹性、按需扩展,的,阿里,云计算,资源管理,敏捷,和,弹性,是互联网,IT,架构的核心要素,阿里云通过公安部信息安全系统等级保护备案,ECS(,弹性计算,),、,RDS,(关系型数据库服务)、,ODPS,(开放数据处理服务)、,OSS,(开放存储服务)、,OTS,(开放结构化数据服务),OSS,(开放存储服务)、基础网络,等系统,均通过,等保三级,测评,.,2014,年,1,月,阿里云通过工信,部,可信,云,服务,认证,通过,ISO27001,信息安全管理国际认证,阿里云于,2012,年已取得,ISO27001,国际,认证,与,传统,IDC,运营商仅将认证范围局限于物理基础设施不同,阿里云的,认证不但覆盖提供,物理基础设施的所有,IDC,,并且,涵盖所有,云服务,,包括,ECS,、,RDS,、,ODPS,、,OSS,、,OTS,、,云,盾以及,云监控服务,。,通过云安全国际认证,(CSA-STAR),并获得,全球第一家金牌资质,阿里,云计算,安全,合规,全方位的云计算安全保证,云计算安全架构,云平台,安全,应用安全,数据安全,网络安全,物理安全,系统安全,主机入侵防御系统,主机安全镜像,安全漏洞修复,网络访问控制,DDoS攻击防御,云,盾,安,全,管,理,平,台,Web应用防火墙,安全组防火墙,恶意主机检测,防IP/MAC/ARP欺骗,物理隔离,电力保障,介质管理,生物识别,数据库,防火墙,访问,控制,分层隔离,碎片,存储,网站安全漏洞检测,加密,传输,清零销毁,云计算,环境下的,集中自动化,运维管理,云计算,的系统是一个,不断发展,的大规模系统,并不是一个传统的,IT,行业的,交付模型,,而是,不断维护,和,快速迭代,,,不断优化,的过程和服务,。系统运维是云计算产品的,一部分,需要阿里云集中运维保障,大规模云计算系统运,维,的困难:,机器一定会坏,,大规模,IT,系统应该如何自动化处理(如,0.01%,硬盘故障,对于上千台机器每天都有坏盘问题),人一定会在开发中写出,bug,怎么进行系统的损害控制,系统一定会到达瓶颈,,如何进行自动化机器扩容,随着系统演进,,性能指标会不断发生变化,,如何保证以最低成本满足特定访问量的要求,如何,能,快速响应业务爆发时的资源开销需求,,提供无差别的,用户,体验,系统分布式,部署下,,不可能只依靠外部系统监控来,定位问题,如何,快速定位、隔离及解决问题,集中运维解决方案:,由,专业的,技术保障,团队,724,在线运维,统一,收集反馈和进行问题追踪,,记录和追踪各,类,故障,联合研发人员进行系统升级、产品迭代、系统优化,服务性能优化,通过部署云计算自动化运维工具,集中,运,维,及时发现问题、隔离问题、修复问题,每个系统都,有基线,自动告警以快速,感知,追责原则,各运维模块有明确,的责任人,,,引导,所有系统进行更准确的监控,和更高效的处理,运维安全,管控,专享集群数据中心,飞天,-,大规模分布式计算系统,阿里云计算基础服务,ECS,RDS,OSS,OTS,ODPS,专享集群,PaaS,层应用支撑平台,专享集群,专享集群应用,VPC1,VPC2,VPC,3,VPCn,通信加密,身份鉴别,权限控制,安全审计,双因素认证,命令级审计,权限平台,SSH/VPN,堡垒机,(,服务器,),通信加密,身份鉴别,权限控制,安全审计,双因素认证,操作级审计,权限平台,HTTPS/VPN,BUC(SSO,管控,平台,),运,维人员,入侵检测,内核防提权,Webshell,检测,禁止主动外连,异常文件拖取监控,APT,检测,七星阵(VDI),终端管理,补丁管理,网络准入,端口、漏洞扫描,蜜罐,帐号风控,认证,授权,审计,监控,沙箱,SOC,办公网,行为审计,运,维人员,运维人员必须经过认证和授权才能登录堡垒机和管控平台;,运维人员只能通过统一的入口对专享集群进行运维操作;,运维人员无法访问业务数据;,运维人员无法拷贝数据;,运维,人员的所有,操作都会被审计;,黑客无法,通过其他网络,渗透运维系统入侵专享集群;,提纲,淘宝技术架构发展历程,阿里云产品及技术介绍,参考案例,上云方案,为什么做杭州政务云?,硬件重复投资,,60%,购买硬件,服务器效率不到,30%,;,数据共享和业务协同问题没有得到解决;,系统重复建设,同类型的信息化系统多个部门建设;,杭州政务云解决什么问题?,推进基础设施统一上云,解决硬件设备重复投资,提升效能;,业务系统和基础设施运维分开;,杭州政务云建设如何推动?,云计算技术的突破,使得政务云可以探索新的模式和创新。政务云是革新和革命,推动政务云建设需要进行四个转变:,1,、观念转变,2,、技术转变,3,、模式转变,4,、运维转变,取得的效果,一期,40,多个系统上云,目前已完成,30%,有效降低建设和运营成本,1/3,应用程序和基础设施部署和管理的灵活性,统一安全保障与按需安全部署相结合,专业化服务,政府可专注于自身的核心责任,浙江省,政务云,负载均衡:,SLB,数据库:,RDS,应用服务器:,4,个,ECS,实例,对象存储:,OSS,数据库备份,快照,传 统 架 构,上 云 架 构,Internet,参考案例:杭州市停车收费系统新旧架构对比,备份服务器,IBM X3650,数据库服务器,IBM P550,数据库服务器,IBM P550,负载均衡设备,(,Radware,AppDirector,3020,),带库,IBM TS3200,磁盘阵列,IBM,DS4700,GPRS,前置机,IBM X3850M2,WIFI,前置机,IBM X3850M2,Internet,光纤,交换机,IBM,2005-B16,光纤,交换机,IBM,2005-B16,网络,交换机,Catalyst 3560,网络,交换机,Catalyst 3560,应用服务器,IBM X3850M2,应用服务器,IBM X3850M2,前置机:,2,个,ECS,实例,数据加载,WIFI/GPRS,项目,型号,数量,数据库,服务器,IBM P6,550(4C/8G),2,应用,服务器,IBM X3850M2,2,磁盘阵列,IBM DS4700,1,城市停车管理平台,前置机,IBM X3850M2,2,中间,件,IBM Websphere,1,数据库,Oracle 10g,企业版,1,网络交换机,CISCO,Catalyst,3560,2,光纤,存储,交换机,IBM 2005-B16,2,备份服务器,IBM X3650,1,备份软件,IBM TSM,1,备份磁带库,IBM TS3200,1,负载均衡设备,RadwareAppDirector 3020,1,防火墙,网御神州,SecGate 3600-F3-VPN,2,云服务,配置,数量,SLB,(负载均衡),4,个,Backend,Server,1,ECS,(,前置机,),ECS(4C/8G,5M/500G),2,ECS,(,应用服务器,),ECS(4C/8G,5M/500G),4,RDS,新,7,型,RDS,(,24G/1T,),1,OSS,按需,1,杭州市停车收费系统建设成本,(CAPEX),对比,成本仅为原有系统,15%,左右!,(,还,未计算传统架构运维,成本,),原有系统,阿里云,提纲,淘宝技术架构发展历程,阿里云产品及技术介绍,参考案例,上云方案,OLAP,Query,OLTP,SLB,RDS/DRDS,:数据库,数据库备份,数据,加载,负载均衡:,SLB,提供,DNS,域名解析,及流量负载,均衡,数据层:,RDS,的,MySQL,数据库创建一个高可用,架构,可灵活扩展;,OSS,支持海量非结构化分布式存储;,OTS,支持海量结构化数据高性能分布式查询;,ODPS,支持数据仓库和大数据存储与分析;,应用服务层:,运行在,ECS,实例上的应用服务器集群,可灵活扩展,Web,服务层:,运行在,ECS,实例上,的,Web,服务器,集群,可灵活扩展,门户,E,CS,实例:,Web,服务器,E,CS,实例:应用服务器,E,CS,实例:查询应用服务器,业务管理,OSS,:,对象存储服务,OTS,:,大表,数据服务,数据,加载,ODPS,:,数据仓库,/,大数据分析,查询服务,E,CS,实例:,BI,服务器,决策分析,文件、日志、快照,OCS,:,缓存,服务,数据刷新,传统,IT,系统上云整体方案,应用层,/,服务层上云解决方案,PC Server,PC Server,PC Server,PHP,应用,.Net,应用,J2EE,应用,ESB,业务流程引擎,搜索,引擎,BI,分析,ETL,工具,消息队列,PC Server,PC Server,PC Server,飞天,ECS+SLB,云服务器,云服务器,云服务器,特点:,单机,性能要求不高,无状态,可横向扩展;,应用,/,服务种类繁多,以,B/S,模式为主;,系统的不同,所选择服务器种类不同,主要为,X86,PC,服务器。,PHP,应用,.Net,应用,J2EE,应用,ESB,业务流程引擎,搜索,引擎,BI,分析,ETL,工具,消息队列,数据管理层上云解决方案,RDS,RDS,OTS,ODPS,实时性要求不高的业务系统,简单,OLTP,型,,RAS,要求低,多采用单机,+,本地存储构建,实时要求高的业务系统,关键,OLTP,型,,RAS,要求高,采用小机,+,磁阵列,+,Oracle RAC,查询服务,实时查询型,,可用性要求高,,采用小机,+,磁阵列,+Oracle RAC,数据仓库,/,大数据分析,大容量线下存储,针对海量数据做挖掘分析,,数据处理实时性,要求较低,,可用性要求高,,采用,小机,+,磁,阵列,+Oracle RAC/MPP,传统,政务系统,数据管理,阿里云,服务方案,文件存储,非,结构化文件存储,数据量大,可用性要求高,多采用,NAS,构建,OSS,instance,Jvm Container,53,Extractor,Applier,RDS,Oracle,DB,translator,愚公,数据迁移工具,一个,Jvm Container,对应多个,instance,,每个,instance,对应于一张表的迁移任务,每个,instance,分为三部分,extractor,(,从源数据库上提取数据,可分为全量,/,增量实现,),translator(,将源库上的数据按照目标库的需求进行自定义转化,),applier,(,将数据更新到目标库,可分为全量,/,增量,/,对比的实现,),上云评估工具,筋斗云,新增评估,项目,采集工具下载(安装在客户一台,windows,上,分发采集到预采集的服务器上,采集各个服务器的物理环境配置和性能数据),自动(或者合作伙伴人工点击按钮)上传采集数据到,OSS,后台进行数据分析和匹配阿里云最佳产品模型,给出阿里云产品配置和数量建议,下载建议书,主要对客户系统(包括物理或者虚拟线上环境)进行在线评估,在线抓取用户服务器配置、性能和应用信息等,结合阿里云的计算模型和产品规格,给出最佳的阿里云产品组合建议。,
展开阅读全文