几种常用关系型数据库的架构和实现原理.docx

资源描述

几种常用关系型数据库的架构和实现原理 —、ORACLE3 (―)Oracle 架构3 1、用户连接进程4 2、SGA (System Global Area) 4 3、后台进程5 4、存储结构6 (二) Oracle RDBMS 的运行过程7 (三) 写SQL语句的执行过程7 (四) Oracle的高可用性架构8 1、Oracle RAC (Real Application Clusters) 8 2、Data Guard9二、MYSQL10 (-)MySQL 架构10 1、连接器 (Connectors) 10 2、管理服务组件和工具组件(Management Service & Utilities)10 3、连接池组件(Connection Pool)10 4、SQL 接口组件(SQL Interface)11 5、查询分析器组件(Parser)11 6、优化器组件(Optimizer) 11 7、缓存主件(Caches & Buffers) 11 8、MySQL存储引擎11 9、物理文件(File System) 11 (-)一个查询流程图11 (三)MYSQL的高可用架构12 1、主从复制模式12 2、MHA (Master High Availability) 13 3、MGR (MySQL Group Replication) 14三、POSTGRESQL14 (—)PostgreSQL 的体系架构14 1、主进程Postgres (常驻进程) 15 2、Postgres (子进程),子进程16 3、后台进程(Background Process) 16 4、共享内存和本地内存17 (-)数据结构18 1、数据库相关概念:18 2、表空间相关概念:18 3、表相关概念:19 (三)后端进程的处理流程19二、MySQL 二、MySQL (-)MySQL 架构连接器(Connectors) 1、连接器(Connectors) MySQL向外提供的接口，如java, . net, php等语言可以通过该组件来操作SQL语句，实现与SQL的交互。 2、管理服务组件和工具组件(Management Service & Utilities)提供对MySQL的集成管理，如备份(Backup),恢复(Recovery),平安管理(Security)等 3、连接池组件(Connection Pool)负责监听对客户端向MySQL Server端的各种请求，接收请求，转发请求到目标模块。每个成功连接MySQL Server的客户请求都会被创立或分配一个线程，该线程负责客户端与MySQL Server端的通信，接收客户端发送的命令，传递服务端的结果信息等。 4、SQL 接口组件(SQL Interface)接收用户SQL命令，如DML, DDL和存储过程等，并将最终结果返回给用户。 5、查询分析器组件(Parser)首先分析SQL命令语法的合法性，并尝试将SQL命令分解成数据结构，假设分解失败, 那么提示SQL语句不合理。 6、优化器组件(Optimizer)对SQL命令按照标准流程进行优化分析。 7、缓存主件(Caches & Buffers) 缓存和缓冲组件8、MySQL存储引擎 MySQL属于关系型数据库，而关系型数据库的存储是以表的形式进行的，对于表的创建，数据的存储，检索，更新等都是由MySQL存储引擎完成的。因MySQL的开源性，允许第三方基于MySQL骨架，开发适合自己业务需求的存储引擎。因此，MySQL支持的存储引擎种类较多，可以分为官方存储引擎和第三方存储引擎。当前，MySQL 的存储引擎有 MylSAM、InnoDB、NDB、Archive、Federated、Memory. Merge> Parter> Community> Custom等。其中，比拟常用的存储引擎包括InnoDB、 MyISAM 和 Momeryo9、物理文件(File System) 实际存储MySQL数据库文件和一些日志文件等的系统，如Linux, Unix, Windows等。 (二)一个查询流程图初始化初始化 Connetors 连接管理连接线程用户命令分发模块曰志记录模块表变史模块复制模块表维护模块状态模块访问控制模块命令块查询优化器表管理模块存储引争接口 Pluggable Storage Engines File System （三）MySQL的高可用架构因MySQL的开源属性，其高可用架构非常灵活，目前常用的主要有以下几种: 1、主从复制模式这是MySQL自身提供的一种高可用解决方案，数据同步方法采用的是MySQL replication技术。为了到达更高的可用性，在实际的应用环境中，需要配合高可用集群软件keepalived来实现自动failover,否那么，需要手工切换。 Web Server 2、MHA (Master High Availability) MIIA是相对成熟的高可用解决方案，该软件由两局部组成：MHA Manager (管理节点) 和MHA Node (数据节点)。搭建MHA时，要求一个集群必须最少有三台数据库服务器，一主二从(即一台master, 一台备用川aster,另外一台slave)。 MHA Manager可以单独部署在一台独立的机器上管理多个master-slave集群，或部署在一台slave节点上，MHA Node运行在每台MySQL服务器上。运行时，MHA Manager会定时探测集群中的master节点，当master故障时，会自动将最新数据的slave提升为新的master,然后将其他所有slave重新指向新的mastero 整个故障转移过程对应用程序完全透明。整个切换过程如下： o 从宕机崩溃的master保存二进制日志事件(binlog events); o识别含有最新更新的slave； o 应用差异的中继日志(relay log)到其他的slave； o 应用从master保存的二进制日志事件(binlog events)； o 提升一个slave为新的master； o使其他的slave连接新的master进行复制；3、MGR (MySQL Group Replication) MGR是MySQL官方推荐的另一种高可用架构，复制组间的数据同步基于Paxos协议。当客户端发起更新事务时，该事务先在本地执行，执行完成之后就要发起对事务的提交操作。在还没有真正提交之前，需要将产生的复制写集广播出去，复制到其它成员。如果冲突检测成功，组内决定该事务可以提交，其它成员可以应用，否那么就回滚。 Master 1 Master 2 Master 3 execute Consensus r certi^J [relay log j r\ apply j [binlog J [commit j commit { certify ] r. 「 relay log E_•_i apply LJ binlog —1 r1 commit .L J 组复制可以在两种模式下运行： ■单主模式下，组复制具有自动选主功能，每次只有一个Server成员接受更新, 其它成员只提供读服务。 ■多主模式下，所有的Server成员都可以同时接受更新，没有主从之分，成员角色是完全对等的。三、PostgreSQL（一）PostgreSQL的体系架构 PostgreSQL使用C/S模式提供服务。客户端和服务器可以在不同的主机上，通过TCP/IP进行网络连接，架构如下：共享内存本地内存数据缓冲区WAL缓冲区Clog缓冲区临时缓 work_m manintance_ 冲区emwork me 文件存储数据文件WAL文件控制文件 1、主进程Postgres （常驻进程）主进程是PostgreSQL启动时，第一个启动的进程Postgres。启动时，他会执行恢复、初始化共享内存，启动后台进程。当有客户端发起链接请求时，postgres会生成子进程，同时创立后端进程。是整个数据库实例的总控进程，负责启动和关闭该数据库实例。 Background Process At initial startup, fork () 3f Send query request and result B»€kend Process Client Process Postmaster Process 2、Postgres（子进程），子进程 Postgres接受前端请求，对数据库进行检索，最后返回结果。如请求是对数据库进行更新，会先记录日志（PostgreSQL称为WAL日志），以便宕机重启时的数据恢复。另外，日志会定期归档保存，以便需要时进行数据恢复。 3、后台进程（Background Process） ■ Syslogger （系统日志）进程将错误信息写到log日志中。 ■ BgWriter （后台）进程周期性的将脏内存块写入文件。 ■ Checkpointer当检查点出现时，将脏内存块写到数据文件 ■ WalWrite （预写式日志）进程将WAL （Write Ahead Log预写式日志）缓存写入WAL文件。 ■ PgArch （归档）进程在归档模式下时，复制WAL文件到特定的路径下。 WAL日志会被循环使用，PgArch在归档前会把WAL H志备份出来。通过PITY （Point in Time Recovery）技术，可以对数据库进行一次全量备份后，该技术将备份时间点之后的WAL日志通过归档进行备份，使用数据库的全量备份再加上后面产生的WAL日志，即可把数据库向前推到全量备份后的任意一个时间点。 ■ AutoVacuum （自动清理）进程当自动vacuum被启用时,用来派生autovacuum工作进程。autovacuum进程的作用是在需要时自动对膨胀表执行vacuum操作。在PostgreSQL数据库中，对表进行DELETE操作后，旧的数据并不会立即被删除，并且，在更新数据时，也并不会在旧的数据上做更新，而是新生成一行数据。旧的数据只是被标识为删除状态，只有在没有并发的其他事务读到这些就数据时，它们才会被清楚。这个清除工作就有AutoVacuum进程完成。 -PgStat （统计数据收集）进程用来收集数据库统计信息。 4、共享内存和本地内存共享内存 PostgreSQL启动后，会生成一块共享内存，用于做数据块的缓冲区，以便提高读写性能。WAL日志缓冲区和Clog缓冲区也存在共享内存中，除此之外还有全局信息比方进程、锁、全局统计等信息也保存在共享内存中。数据缓冲区通过BgWrite进程，定期将数据写入数据文件。WAL缓冲区通过WALWrite 进程写入WAL文件，并通过PgArch定期进行归档，写入归档日志 ■本地内存非全局存储的数据都存在本地内存中，主要包括： o临时缓冲区：用于临时表。默认值为8MB o work_mem:用于排序、位图索引、哈希链接和合并链接操作。默认值为4MB。。 o manintance_work_mem:用于vacuum和创立索引操作。默认值为64MB。 (二) 数据结构1、数据库相关概念： PostgreSQL由一系列数据库组成。一套PostgreSQL程序称之为一个数据库群集。当initdb ()命令执行后，templateO , templatel ,和postgres数据库被创立。 template0和templatel数据库是创立用户数据库时使用的模版数据库，他们包含系统元数据表。 initdb ()刚完成后，template。和templatel数据库中的表是一样的。但是templatel 数据库可以根据用户需要创立对象。用户数据库是通过克隆templatel数据库来创立的；2、表空间相关概念： initdb ()后,创立 pg_default 和 pg_global 表空间。建表时如果没有指定特定的表空间，表默认被存在pg.default表空间中。用于管理整个数据库集群的表默认被存储在pg_global表空间中。 pg default表空间的物理位置为$PGDATAbase目录。 pg.global表空间的物理位置^/$PGDATAglobal目录。一个表空间可以被多个数据库同时使用。此时，每一个数据库都会在表空间路径下创建为一个新的子路径。创立一个用户表空间会在$PGDATApg_tblspc目录下面创立一个软连接，连接到表空间制定的目录位置。 3、表相关概念：每个表有三个数据文件：一个文件用于存储数据（文件名是表的OID）；一个文件用于管理表的空闲空间（文件名是0ID_fsm） o 一个文件用于管理表的块是否可见（文件名是0ID_vm） o索引没有一vrn文件，只有OID和OID_fsm两个文件（三）后端进程的处理流程接收前端发送过来的查询（SQL文）构文解析。将SQL文（单纯的文字）转换成构文树parser tree。构文树解析完以后，换为查询树。这时会访问数据库，检查表是否存在，如果存在的话，那么把表名转换为OID。这个处理称为分析处理（Analyze） o因PostgreSQL还通过查询语句的重写实现视图（view）和规那么（rule）,所以需要时，此阶段会对查询语句进行重写。解析查询树后，可生成计划树。按照执行计划里面的步骤可以完成查询要到达的目的。执行结果返回给前端。返回到步骤一重复执行。四、国产关系型数据库国产关系型数据库较多，此处以GaussDBT为例（―）GaussDB T 架构1、内存结构内存结构分为4局部，如以下图: 四、国产关系型数据库19 （―）GAUSSDBT 架构19 1、内存结构19 2、存储结构.21 （二）GAUSSDB T 关键技术21 （三）GAUSSDBT的高可用部署模式22 1、单机和主备部署模式22 2、分布式部署模式23 （四）典型的分布式部署架构23五、主流关系型数据库特点分析25 JDBC/CLI Agent Pools SGA Listener TCP LSNR Agent Log Buffer Data Buffer PC LSNR Agent Agent Agent Daemon Threads Agent CKPT) 「SMON、 fJOBS> fARCH SQL Cache Sort Area Dictionary Cache Session Pool Large Area LOGW LOGR Listener：包括TCP LSNR和IPC LSNR,用于侦听用户的连接请求Agent Pool：代理的连接池 SGA： o Log Buffer:全局日志缓冲区，缓存redo H志 o Data Buffer:全局数据页缓冲区，用于缓存表索引等数据 o SQL Cache :全局执行计划缓冲IX o Sort Area:全局排序/物化缓冲区 o Dictionary Cache:全局数据字典(元数据)缓冲区 o Large pool,大池，存放较大的SQL o Session Pool, 全局 Session 池，用于存放 Session -后台进程 o L0GW：日志写线程，负责将log buffer中的日志写到磁盘。 o CKPT：负责将脏页(Dirty Page)刷到磁盘，保证WAL,并更新Control File。 o SM0N：负责监测系统的状态，比方检测死锁，修复异常的sessiono o JOBS：应用定制的后台任务调度。 o LOGR：日志复制，用于HA和GR。 o ARCH：用于日志文件归档。 2、存储结构数据以文件方式存储，主要有三种文件： DATA FILE,数据文件，用于存放各种数据，单库最多1024个数据文件，每个数据文件最大8T（undo除外,undo最大32G）LOG FILE,日志文件，用于存放redo日志，可以重复使用，最少3组，每个redo日志文件一般建议5-20G CONTROL FILE,控制文件，用于数据库名、数据文件位置等信息，在数据库启动到mount 阶段时会检查。（二）GaussDB T关键技术Data Buffer Log Buffer Insert abc 内存 Pagel Mabcn Page2 “de” Insert de Checkpoint刷盘 ■❶Redo刷盘磁盘 Redo Log 镜像页机制当进行事务提交时，必须先将Redo log刷盘。脏页数据刷盘后，可用Redo日志可回收。如果数据未刷盘前掉电，加电后需要重做Redo,保持数据的一致性。脏页队列：脏页按时序组成链表，即脏页队列，Checkpoint按该队列顺序分组刷盘； Checkpoint任务调度：Checkpoint后台服务线程通过定时、脏页量、RedoLog满，三个策略满足之一会触发刷盘操作；Redo任务调度：Redo后台服务线程通过定时、Redo buffer量、事务提交满足之一时会触发Redo Log Buffer刷盘操作；镜像页机制：刷盘时间相对较长，为防止I/O阻塞，Checkpoint通过一个镜像页面缓存来完成刷盘。采用MVCC机制提高事务并发能力。（三）GaussDB T的高可用部署模式@质■ ,伽津801形式 / tmst町 m或苴靠曰!求皎成 @质■ ,伽津801形式 / tmst町 m或苴靠曰!求皎成 1、单机和主备部署模式主■Ml / 1・1《■大可陶）成1・2 （■大保护）主缶,是亍蝴煜丑集唳愠备 / ♦机性般可*是需沃的肯兄下,，爆帝高可用I 0HKS4 Ek / 电! 2、分布式部署模式 /分布丈#展：IMK技shard钊分，读勇员的旭性扩NT *1翊岫£务量埸宣 /分布丈高可用：支挎快拦 E高可用魅岩（四）（四） ^wdl Shard2ShirdN 典型的分布式部署架构业务应用业务应用 Storage Storage Storage Storage 各组件说明如下： OM (Operation Manager):运维管理模块。提供集群日常运维、配置管理的管理接口、工具。 CM (Cluster Manager):集群管理模块。管理和监控分布式系统中各个功能单元和物理资源的运行情况，确保整个系统的稳定运行。 CN (Coordinator Node):协同调度节点。负责接收来自应用的访问请求，并向客户端返回执行结果；负责分解任务，并调度任务分片在各DN上并行执行。集群中，CN 有多个且CN的角色是平等的。 DN (Datanode):数据节点。负责存储业务数据，执行数据查询任务以及向CN返回执行结果。在集群中，DN有多个。每个DN支持设置多个存储藏机。 GTS (Global Time Server):全局时钟服务器。用于强一致场景下，为各个节点提供逻辑时钟。五、主流关系型数据库特点分析数据库名称苔优点3 缺点3 Oracle— > 可运行于所有主流平台上运行（包括 windows）,支持所有工业标准；“ > 采用进程模式，对多CPU利用率高，性能好；“ > 支持非常复杂的查询和所有类型的连接与合并；" > 有基于本钱的SQL优化器，可以对SQL进行分析、重写和简化、并基于本钱选择索引、确定对表的操作等；" > 是一款优秀的商业软件，•平安性较高，使用广泛：卜 >计算能力强，可用于处理复杂的业务逻辑- > 对硬件的要求较高；3 > L姑§熙金本钱高。3 PostgreSQL*3 > 是一款开源、免费，同时又是强大的关系型数据管理系统；“ > 附带有许多强大的、开源的第二方工具来缩助系统的设计、管理和使用；3 > 采用进程模式，对多CPI•利用率高，性能好；" > 计算能力强，可用于处理复杂的业务送辑。- >不适合繁重的读操作；" > 国内社区活跃度不如 MySQL• 3 MySQL" > 开源，提供的接口支持多种语；I连接操作；" > 可在所有主流平台上运行（包括windows）； a >采用多线程模式，可支持更多的连接：" > 使用广泛，有大量的案例支持；" > 在开源数据库社区中，活跃度最高。“ > 平安机制较差，不建议用于平安性要求很高的系统：“ >对存储过程和触发器支持不够良好，不建议业务逻辑在数据库上实现的系统；W > 只支持局部SQL语法，不支持递归查询、分析函数等；0 > 已被Oracle收购。3 国产数据库。 > 自主研发，符合监管自主可控要求；" > 具有较强的计算能力，数据库可用于处理业务避辑；“ > 目前主要兼容Oracle。3 > 产品推出市场时间不长，产品的成熟度有待市•场验证；“ >应用案例较少- 【摘要】常用的关系型数据库有闭源系列和开源系列，闭源系列有国外数据库（如 Oracle> DB2等）和国产数据库（如GaussDB T等）；开源系列有MySQL、PostgreSQL 等。本文拟介绍几种常用关系型数据库的架构和实现原理，以方便广大用户更进一步了解。涉及产品最新参数指标等请以各官网为准。一、Oracle（一）Oracle 架构 Oracle Server包括数据库（Database）和实例（Instance）两大局部，两者相互独立。数据库由数据文件、控制文件和日志文件组成，实例由内存池和后台进程组成，示意图如下: I Parameter tUe Data files CgNTOl RedoLog Password file Database Archived Log hies 一台Oracle Server可创立多个I）atabase,不同的Database之间相互独立。每个Database有属于自己的全套相关文件，如：密码文件，参数文件，数据文件，控制文件和日志文件 Database由一系列物理文件（如二维表文件）组成。用户不能直接读取Database 中的内容，必须通过Oracle instance才能读取，一个Instance只能连接一个 Database,但是一个Database可以被多个Instance连接。各功能组件说明如下： 1、用户连接进程用户连接进程是连接用户和Oracle Instance的桥梁。包括：用户进程、服务进程和PGA ■ 用户进程User Process当一个 Database User 请求连接到 Oracle Server 时，Oracle Server 创立的 User Processo ■ Server Process 服务进程用于处理Database User和Oracle Server之间的连接。 ■ 程序全局区PGA PGA：由Server Process分配，用于当前User Session的内存区，不同的用户拥有不同的PGA。PGA包含了 Server Process数据和控制信息的内存区域。包括栈空间、Session Info> 私有 SQL 区。 2、SGA (System Global Area) SGA与Oracle性能息息相关，在Instance启动时被分配，关闭时被释放。主要包含如下几种数据结构： ■ 数据库缓冲区(Database buffer cache ) oracle执行SQL语句的区域。当进行数据更新或数据查询时，用户执行的 SQL语句不会直接对磁盘上的数据文件进行更改操作，而是首先将数据文件复制到数据库缓冲区缓存，再更改或查询缓存中的副本。此外，被频繁访问的数据块会存在于数据库缓冲区缓存中。 ■ 日志缓冲区(Redo log Buffer)用于短期存储redo logo ■共享池(Shared Pool) 用于缓存所有频繁执行的代码和频繁访问的对象定义。共享池内有以下三种数据结构： o库缓冲(library cache):存储最近执行的代码o数据字典缓存(data dictionary cache):存储最近使用的对象定义 o PL/SQL缓冲区(PL/SQL buffer):用于存储过程、函数、打包的过程、打包的函数、对象类型定义和触发器。大型池(Large Buffer)用于共享的服务器进程。 JAVA 池(Java Buffer): 只有当应用程序需要在数据库中运行java存储程序时，才需要java池。 3、后台进程后台进程主要用于数据库管理，是Oracle Instance和Oracle Database的联系纽带，分为核心进程和非核心进程。 1) 核心进程： , 数据库写入进程(DBWn) Server process连接Oracle后，通过数据库写进程(DBWn)将数据缓冲区中的“脏缓冲区”的数据块写入到数据文件； ■检查点进程(CKPT) Checkpoint (CKPT)检查点进程主要用于更新数据文件头，更新控制文件和触发DBWn数据库写进程。 , 进程监视进程(PMON) 当后台进程执行失败后负责清理数据库缓存和闲置资源，是Oracle的自动维护机制。 -系统监视进程(SMON)用途如下： O当数据库实例崩溃时，用于数据库实例的自动恢复。 O清除作废的排序临时段，回收整理碎片，合并空闲空间，释放临时段，维护闪回的时间点。 ,重做日志文件和日志写入进程用于记录数据库的改变和记录数据库被改变之前的原始状态，当满足以下条件时，激活LGWR： o提交指令o日志缓冲区超过1/3 o 每三秒O每次DBWn执行之前 2) 非核心进程归档进程(ARCn) 是可选的后台进程，当数据库处于ArchiveLog模式时，自动归档redo log, 并保存数据库的所有修改记录。 SGA (System Global Area)和后台进程组成 Instance。 4、存储结构存储结构可从物理结构和逻辑结构两方面理解。 1)物理结构 Database物理结构：是Database在操作系统中的文件集合，艮"磁盘上的物理文件，主要由数据文件、控制文件、重做日志文件、归档日志文件、参数文件、口令文件组成。数据文件、重做日志文件、控制文件、跟踪文件、警告文件属于数据库文件 ■ Data Files数据文件是数据的存储仓库，数据被使用时才被调入内存中的。 ■ Redo Log Files 重做日志文件包含对数据库所做的更改操作记录，在Oracle发生故障时能够恢复数据。 ■ Control Files 控制文件包含维护和验证数据库完整性的必要的信息。例如，控制文件用于识别数据文件和重做日志文件，一个数据库至少需要一个控制文件。・跟踪文件(Trace Files) instance中运行的每一个后台进程都有一个跟踪文件(trace file)与之相连。Trace file记载后台进程所遇到的重大事件的信息。 ■ 警告日志(Alert Log) 是一种特殊的跟踪文件，每个数据库都有一个跟踪文件，同步记载数据库的消息和错误。参数文件、口令文件、归档文件属于非数据库文件。 ■ Parameter File 实例参数文件，当启动oracle实例时，SGA结构会根据此参数文件的设置内存，后台进程会据此启动。 ■ Password File用户通过提交username/password来建立会话，Oracle根据存储在数据字典的用户定义对用户名和口令进行验证。归档文件是重做日志文件的脱机副本，这些副本可能对于从介质失败中进行恢复很必要。 2）逻辑结构 ■ 表空间用于存储数据库对象的逻辑空间，是信息存储的最大逻辑单位，是一系列数据文件的集合。一个数据库可以由多个表空间组成，每个表空间包括多个段。 -段：是对象在数据库中占用的空间。段是区的集合 ■ 区：是为数据一次性预留的一个较大的存储空间，区是块的集合 -块： ORACLE最基本的存储单位，在建立数据库的时候指定，并被映射到磁盘块。 3）逻辑空间到物理空间的映射Oracle数据咋 i 1 逻N N 轩t表空网物即文件卜勺逻批对象（衣、视图笠） 1 物 JT. 数捆段索引段 1 1 N 构数抑;区网索弓1区m N 数据块数据块物理块（^）Oracle RDBMS的运行过程 1. User访问Oracle Server之前提交一个请求（包含了 db name> password> instance_name> username 等信息）； 2. Oracle Server接收到请求并通过Password File的验证后，分配SGA内存池，启动后台进程同时创立并启动实例； 3. 启动实例之后，User Process 与 Server Process 建立 Connect；Server process 和 Oracle Instance 建立 Sesscion,随后接收用户请求，执行相关操作；（三）写SQL语句的执行过程1 .用户执行SQL语句，Server process收到后，将SQL语句送到Instance,再将SQL语句载入数据库缓冲区。 2. Server Process通知Oracle Database将与SQL语句相关的数据块副本加载到缓冲区中。 3. 在数据库缓存区执行SQL语句，修改数据文件副本，形成“脏缓冲区” 4. CKPT检查到”脏缓冲区”，调用DBWn数据库写进程，在DBWn运行之前，先运行了 LGWR,将数据文件的原始状态和数据库的改变记录到 Redo Log Files 5. 运行DBWn,将“脏缓冲区的内容写入到数据文件” 6. 同时CKPT修改控制文件和数据文件头 7. SMON回收不必要的空闲资源 9 .返回结果给用户（四）Oracle的高可用性架构 1、Oracle RAC （Real Application Clusters）RAC是Oracle数据库的一个群集解决方案，包括计算层和存储层。如以下图所示: 计算节点1 计算层集群管理通讯层侦听监控磁盘共享驱动 /\J 缓存聚合密码文件仔儒存储层 Redolog Undo 参数文件归档日志节点1 通讯层集群管理计算节点n 侦听监控磁盘共享驱动本地存储密码文件 Redolog Undo 参数文件归档日志节点n 共享存储（NFS、OCFS、OCFS2、RAW、ASM） 1) 存储层一一共享存储Oracle RAC的核心是共享磁盘子系统，集群中所有节点必须能够访问所有数据文件、重做日志文件、控制文件和参数文件，因此，这些文件必须存放在共享存储中。常用的共享存储方式有OCFS、OCFS2、RAW、NFS、ASM等。说明如下： OCFS (Oracle Cluster File System) 和 0CFS2 都是文件系统，和 NFS 一样，提供集群环境共享存储的文件系统。 RAW裸设备也是一种存储方式。把共享存储映射到RAW Device, Oracle在存储数据时，选择RAW device存储即可。但相对于文件系统来说，RAW不直观，不便于管理，而且有数量的限制，现已被OCFS取代。 ASM是一种数据库存储的方案，并不是cluster的方案，使用ASM时，还需使用 OCFS/OCFS2 或 RAWo计算层计算层至少需要两台以上的服务器，在每台服务器上安装集群软件和Oracle的RAC 组件，从逻辑结构上看，每个节点都有一个独立的实例，这些实例访问同一个数据库。节点之间通过集群软件的通信层(Coinnmnication Layer)进行通信，利用高速缓存合并技术，实现集群中各节点缓存的高速同步，使得集群中的每个实例，都保存了一份相同的数据库cacheo从而最大限度地低降低磁盘I/O。因此，RAC有如下特点： o每一个节点的实例都有自己的SGA； O每一个节点的实例都有自己的后台进程 O每一个节点的实力都有自己的redo logs o每一个节点的实例都有自己的undo表空间 o 所有节点都共享一份datafiles和controlfiles2、 Data Guard 在Data Gurad环境中，至少有两个数据库，一个主库(Primary Database)处于Open状态，另一个备库(Standby Database)处于standby状态。备库又分物理库和逻辑库。物理库和主库完全一样，通过REDO应用来保持与主库的数据一致性，支持只读服务；逻辑库通过SQL应用，在备库端执行和主库同样的SQL 语句，以此来保持与主库的数据一致，因此文件的物理结构(甚至数据的逻辑结构) 都可以与主库不一致。逻辑库支持读写服务。 Data Guard适合多机房方案，实际部署时，主库部署在主机房，备库部署在其他机房。

展开阅读全文