1、VxWorks SMP多核编程指南 本文摘自 vxworks_kernel_programmers_guide_6.8 第24章 1. 介绍 VxWorks SMP是风河公司为VxWorks设计的symmetric multiprocessing(SMP)系统。它与风河公司的uniporcessor(UP)系统一样,具备实时操作系统的特性。 本章节介绍了风河VxWorks SMP系统的特点。介绍了VxWorks SMP的配置过程、它与UP编程的区别,还有就是如何将UP代码移植为SMP代码。 2. 关于VxWorks SMP 多核系统指的是一个系统中
2、包含两个或两个以上的处理单元。SMP是多核技巧中的一个,它的主要特点是一个OS运行在多个处理单元上,并且内存是共享的。另一种多核技巧是asymmetric multiprocessing(AMP)系统,即多个处理单元上运行多个OS。 (1) 技术特点 关于CPU与处理器的概念在很多计算机相关书籍里有所介绍。但是,在此我们仍要对这二者在SMP系统中的区别进行详细说明。 CPU:一个CPU通常使用CPU ID、物理CPU索引、逻辑CPU索引进行标示。一个CPU ID通常由系统固件和硬件决定。物理CPU索引从0开始,系统从CPU0开始启动,随着CPU个数的增加,物理CPU索引也会增加。逻辑
3、CPU索引指的是OS实例。例如,UP系统中逻辑CPU的索引永远是0;对于一个4个CPU的SMP系统而言,它的CPU逻辑索引永远是0到3,无论硬件系统中CPU的个数。 处理器(processor):是一个包含一个CPU或多个CPU的硅晶体单元。 多处理器(multiprocessor):在一个独立的硬件环境中包含两个以上的处理器。 单核处理器(uniprocessor):一个包含了一个CPU的硅晶体单元。 例如:a dual-core MPC8641D指的是一个处理器上有两个CPU;a quad-core Broadcom 1480指的是一个处理器上有四个CPU。 在SMP系统上运行U
4、P代码总会遇到问题,即使将UP代码进行了更新,也很难保证代码很好的利用了SMP系统的特性。对于在SMP上运行的代码,我们分为两个级别: SMP-ready:虽然可以正常的运行在SMP系统上,但是并没有很充分的利用SMP系统的特点,即没有利用到多核处理器的优势; SMP-optimized:不仅可以正常的运行在SMP系统上,而且还能很好的利用SMP系统的特点,使用多个CPU使多个任务可以同时执行,提高系统的效率,比UP系统的效果更加明显。 (2) VxWorks SMP OS特点 VxWorks单核编程(UP)与SMP编程在多数情况下是一样的。类似的,多数API在UP和SMP编程中是
5、通用的。一些少数UP编程中的API不能在SMP中使用。与此同时,SMP中的一些API在UP中使用时表现的不是SMP中的效果,而是默认UP的效果,或者压根就不能使用(例如,task spinlock 默认表现为task lock)。 本小节将简短介绍一下VxWorks的对称多处理器的一些特点: 多任务:对于传统的UP系统而言,处理多任务的方法是通过任务优先级对CPU资源进行抢占式处理的。而SMP系统则改变了这种方法,它是实实在在的任务、中断的同时执行。实现同时执行的关键是多个任务可以在不同的CPU上执行,当然这需要OS的协调控制。对于UP系统中多任务所谓的同时执行,其实只不过是CPU的快速切
6、换,占有CPU的任务由一个快速切换到另一个。在SMP系统中,同时执行不是幻想而是实实在在存在的。 任务调度机制:VxWorks SMP系统中的任务调度机制与UP中的类似,都是基于优先级的。不同的是,当不同的任务运行在不同的CPU上时,可以实现两个任务的同时执行。 互斥:由于SMP系统允许任务同时运行的情况存在,因此,在UP系统中通过关中断、锁任务调度等这些保护临界资源的手段在SMP系统中将不再适用。这种在所有CPU上通过强行关闭中断、锁任务调度的方法会影响到SMP系统发挥它的特点,将SMP系统带回到UP系统的模式。VxWorks SMP提供一套特殊的任务间、中断间同步/互斥的方法——即UP
7、中的taskLock()和intLock()等将会被VxWorks SMP提供的spinlock,原子操作以及CPU-specific等机制替代。 CPU-Affinity:默认情况下,任意任务可以运行在任意CPU上。VxWorks SMP提供了一种叫做CPU-Affinity的机制,即可以分配任务到指定CPU(CPU逻辑索引)上执行。 (3) VxWorks SMP 硬件特点 VxWorks SMP系统要求硬件必须具备对称多处理器。这些处理器必须是一样的,处理器可以共享内存、可以平等的访问所有设备。VxWorks SMP必须遵循uniform memory access (UMA)
8、结构。 图1显示了一个双CPU的SMP系统 图 1 SMP硬件结构 无论SMP系统中CPU的个数是多少,它们的重要特点是一样的: a. 内存对所有CPU可见,不存在“只属于某个CPU的内存”的情况。即任意CPU可以在任意内存中执行代码; b. 每个CPU都有Memory Management Unit(MMU)。MMU可以使任务在不同的虚拟内存中同时运行。例如,RTP1的一个任务可以在CPU0上运行,与此同时,RTP2的一个任务可以在CPU1上运行; c. 每个CPU可以访问所有设备。设备产生的中断可以通过可编程中断控制器发送到任意CPU上执行; d. 通过多CPU,任务和I
9、SR可以实现同步;通过spinlock,任务和ISR可以实现互斥; e. Snoop bus的作用是使CPU之间的data cache总是保持前后一致性。 (4) VxWorks SMP与AMP的对比 关于SMP与AMP系统中对内存访问的对比如图2所示: 图 2 SMP系统对内存的占用情况 在SMP系统中,所有物理内存被所有CPU共享。内存空间可以用来保存VxWorks SMP镜像、Real-Time Process(RTP)等。所有CPU可以读、写、运行所有内存。内核任务、用户任务可以在任意CPU中执行。 在SMP系统中,所有内存、设备被所有CPU共享,CPU之间的主要通
10、讯是如何防止“同时访问共享资源”的情况发生。 图 3 AMP系统对内存的占用情况 在AMP系统中,每个CPU对应一个VxWorks镜像的拷贝,它们只能被对应的CPU访问。因此,CPU1中执行的内核任务不可能在CPU0的内存中执行,反之亦然。对于RTP也是一样的。 在AMP系统中,一些内存是共享的,但是在这些共享内存中读写数据是严格受到控制的。例如,在两个VxWorks镜像中传递数据等。硬件资源根据OS被划分,因此CPU之间的通信只有在访问共享内存时才会发生。 3. VxWorks SMP配置说明 Spinlock的调式版本组件 INCLUDE_SPINLOCK_DE
11、BUG提供了spinlock的版本,这对调试SMP APP有帮助。 在包含INCLUDE_SPINLOCK_DEBUG的同时,最好要加入INCLUDE_EDR_ERRLOG组件,它可以记录spinlock的错误信息。 CPU配置参数组件 INCLUDE_KERNEL组件中包含了一些对VxWorks SMP参数的配置,包括: VX_SMP_NUM_CPUS代表VxWorks SMP的使能CPU个数。所有体系结构的最大使能CPU个数如下:ARM=4,IA32=8,MIPS=32,PowerPC=8,VxWorks Simulator=32。 ENABLE_ALL_CPUS默认是TRU
12、E,代表所有已配置的CPU使能。这个参数也可以设置为FALSE,一般出于调试目的,此时只有逻辑CPU0是使能的,只有通过kernelCpuEnable()才可以使能指定的CPU。 VX_ENABLE_CPU_TIMEOUT代表CPU使能超时时长,当ENABLE_ALL_CPUS是TRUE时,该值表示所有CPU的使能时长,当ENABLE_ALL_CPUS是FALSE时,在kernelCpuEnable()被调用时,它用来表示CPU的启动时长。 VX_SMP_CPU_EXPLICIT_RESERVE表示将指定CPU排除在“可使用CPU-Affinity属性的CPU池”之外。它是一个字符串,若填
13、写“2 3 7”,则代表CPU2,3,7不能使用CPU-Affinity属性。即不能通过taskCpuAffinitySet()分配任务到这些CPU上运行。 当某个CPU被VX_SMP_CPU_EXPLICIT_RESERVE包含,唯一能够使他们恢复预留属性的方法是调用vxCpuReserve()。 4. 在多核AMP系统上配置VxWorks SMP 略 5. 启动VxWorks SMP 在WorkBench开启后会有一个默认的SMP的simulator,如图4所示: 图 4 WR自带的SMP虚拟机 点击连接后启动,启动过程如图5所示,代表目前已经进入VxWo
14、rks SMP系统以及当前CPU的个数。 图 5 SMP虚拟机启动过程 启动后在SHELL中输入i可以查看系统目前运行的任务,你会发现两个idle任务,它们分别运行在两个不同的CPU上。如图6所示。 图 6 SMP系统任务运行情况 6. VxWorks SMP编程 VxWorks单核编程(UP)与SMP编程在多数情况下是一样的。类似的,多数API在UP和SMP编程中是通用的。一些少数UP编程中的API不能在SMP中使用。与此同时,SMP中的一些API在UP中使用时表现的不是SMP中的效果,而是默认UP的效果,或者压根就不能使用(例如,task spinlock 默认表
15、现为task lock)。 由于SMP系统的特殊性,因此SMP编程需要特别注意,尤其是在互斥/同步机制上,在使用的时候需要充分考虑如何提高系统的性能。在VxWorks SMP系统中针对每个CPU都有一个idle任务,这在UP中是没有的。Idle任务是最低优先级(用户级任务是不能达到这么低优先级的)。当CPU进出idle状态时,idle任务会提供任务上下文,这可以用来监视CPU的利用率情况。 当CPU无事可做时,Idle任务的存在不会影响CPU进入睡眠状态(当电源管理开启时)。 可以使用kernelIsCpuIdle()或者kernelIsSystemIdle()这两个API查看一个指定C
16、PU是否执行了idle任务或者所有CPU是否执行了idle任务。 【注意】不要对idle任务进行挂起、关闭、跟踪、改变优先级等一系列操作。 SMP的互斥/同步机制 SMP编程与UP编程最大的一个不同就是互斥/同步API的使用。有一些API在这两种编程中都可以使用,而有一些则不同。此外,UP编程中的一些隐式同步技巧(例如使用任务优先级替代显示同步锁等)在SMP中是不能用的。 与UP系统不同,SMP系统允许真正意义上的同时执行。即多个任务或多个中断可以同时执行。在绝大多数情况下,UP系统中与SMP系统中的互斥/同步机制(例如,信号量、消息队列等)是一样的。 但是,UP中的一些机制(例
17、如,关中断、挂起任务抢占机制以此来保护临界资源等)在SMP中是不适用的。这是因为这些机制阻碍了同时执行的理念,降低了CPU的利用率,是的SMP系统向UP系统的回溯。 SMP编程与UP编程的一点不同是关于taskLock()和intLock()的使用上。SMP提供了以下互斥/同步锁机制进行替代: a. 任务级、中断级的spinlock; b. 任务级、中断级的CPU-specific; c. 原子操作; d. 内存障碍(memory barrier) 7. spinlock互斥/同步机制 在UP(单核)编程中通过信号量的方法可以实现task的互斥与同步,在SMP系统中可以继
18、续沿用信号量的机制,而spinlock则用于替换UP编程中使用taskLock()和intLock()的地方。 简介taskLock()和intLock() 通过taskLock()可以关闭系统的任务调度机制,调用taskLock()的任务将是唯一获得CPU运行资源的任务,直到这个任务调用taskUnlock()为止。intLock()与taskLock()类似,intLock()用于关闭中断,使得中断IRS无法执行,直到调用者调用了intUnlock()。 Spinlock具有“满内存障碍”属性 VxWorks spinlock的获取与释放操作具备“满内存障碍”属性。“满内存
19、障碍”属性可以使读、写内存操作按照严格的顺序执行而不受到多CPU的影响。因此,在申请与释放spinlock之间进行更新的数据可以保证“更新顺序”。 Spinlock的种类 Spinlock分为两种:中断级spinlock和任务级spinlock: a. 中断级spinlock:可用于关闭本地CPU的中断。当任务调用中断级spinlock时,将会关闭本CPU的任务抢占机制; b. 任务级spinlock:用于关闭本地CPU的任务抢占机制。 (本第CPU指的是调用这些API的CPU) Spinlock的作用以及使用说明 与信号量不同的是,当一个任务试图申请一个已被另一个任务占
20、用的spinlock时,该任务并不会进入阻塞状态(pend),而是可以继续运行,它会进入一个简单的、紧凑的循环直到spinlock得到释放。 这种等待spinlock释放的状态可以用’spinning’和’busy waiting’来描述。在此,我们可以看出spinlock的优点和缺点。优点是:由于任务(或ISR)在等待spinlock的时候没有进入pend状态而是继续执行(一个简单的循环用于获取spinlock),这就避免了任务调用度以及上下文切换的消耗。缺点是:循环操作没有实际意义,会占用CPU资源。 因此,只有在必要时才使用spinlock。即占用spinlock的时间越短,spin
21、lock的优势发挥的越明显(例如UP中的taskLock()和intLock())。否则,如果占用spinlock较长的时间,在UP编程中的缺陷(增加了任务和中断的响应时间)同样也会在多核编程中出现。 在一个CPU上获取spinlock,并不会影响另一个CPU上任务和中断的调度机制。当一个任务在持有spinlock的时候,该任务不能被删除。 (1) 中断级spinlock 任务和中断都可以获使用中断级spinlock。有两种中断级spinlock:确定性的和非确定性的。 【注意】在UP系统中,中断级spinlock与intLock()和intUnlock()的效果是一样的。
22、确定性中断级spinlock 确定性中断级spinlock的最大特点是:公平、确定性。Spinlock会分给第一个申请的中断或任务。申请的spinlock会屏蔽掉本地CPU的其他中断。如果是一个任务申请了中断用spinlock,本地CPU的任务调度机制将被停止直到该任务释放spinlock。Spinlock确保了任务可以独占CPU完成一些操作。其他CPU上的中断和任务不会受到干扰。确定性中断级spinlock的API全部包含在spinLockLib中,API如表1所示。 表 1 确定性中断级spinlock的API API 描述 void spinLockIsrInit(
23、 spinlockIsr_t *pLock, /* pointer to ISR-callable spinlock */ int flags /* spinlock attributes */ ) 初始化确定性中断级spinlock void spinLockIsrTake( spinlockIsr_t *pLock /* pointer to ISR-callable spinlock */ ) 获取确定性中断级spinlock void spinLockIsrGive( spinlockIsr_t *pLock /* poin
24、ter to ISR-callable spinlock */ ) 释放确定性中断级spinlock 非确定性中断级spinlock 非确定性中断级spinlock提供了更高的性能,但是当多个CPU试图同时申请一个spinlock时,它并不保证公平性和确定性。即非确定性中断级spinlock并不一定会把spinlock分配给第一个申请者。它的优势在于中断响应时间较短,即当CPU等待获取spinlock的时候,中断不会被屏蔽。API如表2所示。 表 2 非确定性中断级spinlock的API API 描述 void spinLockIsrNdInit( spinl
25、ockIsrNd_t * spin /* pointer to spinlock */ ) 初始化非确定性中断级spinlock int spinLockIsrNdTake ( spinlockIsrNd_t * spin /* pointer to spinlock */ ) 获取非确定性中断级spinlock void spinLockIsrNdGive ( spinlockIsrNd_t * spin, int key /* return value of spinLockIsrNdTake */ ) 释放非确定性中断级spinlo
26、ck (2) 任务级spinlock 任务级spinlock(中断不可调用该spinlock)可以关掉本地CPU的任务切换机制,使持有spinlock的任务独占CPU完成一些操作。同时,它不会对其他CPU上的任务调度机制产生影响。 【注意】SMP中任务级spinlock等同于UP编程中的taskLock()和taskUnlock() API如表3所示。 表 3 任务级spinlock的API API 描述 void spinLockTaskInit( spinlockTask_t *pLock, /* pointer to task-only spin
27、lock */ int flags /* spinlock attributes */ ) 初始化任务级spinlock void spinLockTaskTake( spinlockTask_t *pLock /* pointer to task-only spinlock */ ) 获取任务级spinlock void spinLockTaskGive( spinlockTask_t *pLock /* pointer to task-only spinlock */ ) 释放任务级spinlock (3) Spinl
28、ock的使用注意事项 由于SMP系统允许任务的同时运行,因此在使用spinlock的时候需要注意以下事宜: a. spinlock最好用于短时间占用的情况; b. 任务(或中断)一次只能申请一个spinlock。当一个已申请了spinlock的实体再一次申请了另一个spinlock时,很有可能会造成死锁; c. 任务(或中断)不能申请它已经持有的spinlock。这可能会造成死锁; d. 持有spinlock的任务(或中断)不能再调用一些特殊函数(尤其是内核函数),由于这些特殊函数本身持有spinlock,这种操作可能会导致死锁。 (4) Spinlock的调式版本 Spin
29、lock的调试版本可以运行那些开发中使用了spinlock的程序对spinlock的情况进行调试。这需要添加INCLUDE_SPINLOCK_DEBUG组件。如果添加了INCLUDE_EDR_ERRLOG组件,则当由使用spinlock造成的系统异常进而重启后,相关信息会被记录下来。会产生错误信息的情况如表4所示。 表 4 使用spinlock会出现错误的情况 使用的API 错误信息 spinLockTaskTake() 一个中断任务使用了该API 申请了已持有的spinlock 嵌套申请spinlock spinLockTaskGive() 一个中断任务使用了该API 试
30、图释放一个没有申请过的spinlock spinLockIsrTake() 申请了已持有的spinlock 嵌套申请spinlock spinLockIsrGive() 试图释放一个没有申请过的spinlock (5) Spinlock中限制使用的系统API 当任务(或中断)持有spinlock时,一些系统API不能被调用(具体原因见Spinlock的使用注意事项)。这样做为的是防止持有spinlock的任务或ISR进入内核临界区,这可能会导致死锁的发生。这种限制对于intCpuLock()也是适用的。这是因为有些内核API需要中断操作。 这些限制看起来好像使spinloc
31、k的运用受到影响,但是它们却是有必要的。Spinlock适用于进程间很快的同步/互斥情况。若将spinlock用在会进行大量操作——包括内核API调用等——的情况时,则会导致SMP性能的下降。这是因为当使用spinlock时,任务抢占机制以及中断都将会被关闭。图7列出了在使用spinlock和CPU lock时限制使用的系统API。 图 7 spinlock中限制使用的系统API 8. CPU-specific互斥机制 VxWorks SMP提供了一种基于CPU-specific的互斥机制,它可以严格限定互斥操作的范围在调用该操作的CPU(本地CPU)上执行。通过设计CPU-
32、specific使得将UP代码转到SMP系统上变得容易。 (1) 中断级CPU-specific 中断级CPU-specific可以关闭本地CPU上的中断。例如,当任务A在CPU-0上运行一个本地CPU的中断锁操作,则该CPU将不再允许其他中断执行,直到任务A释放这个锁。SMP系统中其他的CPU将不会受到影响。 对于那些想要使用CPU-specific互斥机制的任务和ISR,必须使用CPU-Affinity将它们指定运行在本地CPU上,只有这样CPU-specific互斥才会有意义。 与spinlock一样,在执行中断锁的任务中有些系统API不能被使用(详见图7)。 中断级CPU-s
33、pecific的API如表5所示。 【注意】在UP中,它们默认的操作与intLock()和intUnlock()一样。 表 5 中断级CPU-specific互斥API API 描述 int intCpuLock (void); 当CPU-0上的任务或ISR调用了该函数后,则禁止在CPU-0上的一切中断调用。 void intCpuUnlock( int lockKey /* lock-out key returned by preceding intCpuLock() */ ) 恢复在CPU-0上的中断调用。 (2) 任务级CPU-specific 任
34、务级CPU-specific可以关闭调用该API的CPU上的任务抢占机制。例如,当运行在CPU-0上的任务A调用了任务锁操作,则该CPU上将禁止任务切换,即该CPU上其他任务将不能得到运行,直到任务A释放了这个锁或执行了一个阻塞操作。 【注意】调用该操作的任务是不能被移交到另外的CPU上运行的,直到这个锁被释放。 SMP系统中其他的CPU将不会受到影响。对于那些想要使用CPU-specific互斥机制的任务和ISR,必须使用CPU-Affinity将它们指定运行在本地CPU上,只有这样CPU-specific互斥才会有意义。 任务级CPU-specific的API如表6所示。 【注意】
35、在UP编程中,他们默认的操作与taskLock()和taskUnlock()类似。 表 6 任务级CPU-specific互斥API API 描述 taskCpuLock() 当CPU-0上的任务或ISR调用了该函数后,则禁止在CPU-0上的一切任务切换。 taskCpuUnlock() 恢复在CPU-0上的任务切换。 9. Memory Barrier 在现代多核体系中,CPU需要对读、写操作完成重排序,为的是提高系统的整体性能。而在单核CPU中,这种重排序完全是透明的,因为无论系统如何对读、写操作进行排序,CPU都能确保任何读操作获取的数据都是之前已写入的数据。
36、 在多核体系中,当一个CPU执行了一系列写内存操作时,这些写操作将会在CPU执行操作写到内存之前被排序。CPU可以将这些写内存的操作按任意顺序排列,无论是哪条指令先到达的CPU。类似的,CPU可以将多个读操作并行处理。 由于这种重排序的存在,两个有共享数据的任务不能保证:一个任务在CPU0上执行读、写操作的顺序与另一个任务在CPU1获取对应数据的顺序是一致的。关于重排序问题有一个经典的例子:在一个双核CPU系统中,一个CPU正在准备工作,当设置一个bool变量为true时,告知另一个CPU这个工作准备就绪,在此之前,另一个CPU一直处于等待状态。这个程序的代码就像下面一样: /* CPU
37、0 – announce the availability of work */ pWork = &work_item; /* store pointer to work item to be performed */ workAvailable = true; /* CPU 1 – wait for work to be performed */ while (!workAvailable); doWork(pWork); /* error – pWork might not be visible to this CPU yet */ 这个程序的结果很有可能是CPU1使
38、用的pWork指针指向了不正确的数据,这是因为CPU0会重排序它的写内存操作,这就会导致CPU1在观察到workAvailable改变的时候而pWork还未被更新。 为了解决内存操作排序问题,VxWorks提供了一系列的”memory barrier”操作。这些操作的唯一目的就是提供一种方法可以确保CPU间操作顺序的一致性。memory barrier分为三个主要方面:读memory barrier,写memory barrier,满(读写)memory barrier。 【注意】VxWorks SMP提供了一系列同步原语来保护共享资源。这些原语包括:信号量、消息队列、spinlock等。
39、这些原语中已经包括了满memory barrier功能,不用再添加其他的memory barrier操作来保护共享资源。 【注意】memory barrier不能用在用户模式的RTP app中。 (1) 读memory barrier VX_MEM_BARRIER_R()宏定义提供读memory barrier。VX_MEM_BARRIER_R()会强制所有读操作进行排序。如果没有barrier,CPU会随意的为这些读操作进行排序。对于一个单核CPU而言不受影响。例如,CPU可以随意重排序一下读操作的顺序: a = *pAvalue; /* 读 可能发生在读pBvalue之后 */
40、 b = *pBvalue; /* 读 可能发生在读pAvalue之前 */ 通过在读操作间加入memory barrier,可以保证读的顺序,例如: a = *pAvalue; /* 读 发生在读pBvalue之前 */ VX_MEM_BARRIER_R(); b = *pBvalue; /* 读 发生在读pAvalue之后 */ 在使用VX_MEM_BARRIER_R()后可以确保读数据的顺序是正确的。但是,这种保证只有在“写数据”能够保证顺序正确的前提下才能有效。即VX_MEM_BARRIER_R()和VX_MEM_BARRIER_W()宏定义必须一起使用。 (2)
41、 写Memory Barrier VX_MEM_BARRIER_W()宏定义提供写memory barrier。VX_MEM_BARRIER_W()会强制所有写操作进行排序。以下程序片段来自前面的代码,通过加入写memory barrier后对代码进行了改进: pWork = &work_item; VX_MEM_BARRIER_W(); workAvailable = true; 通过加入barrier可以确保pWork的更新一定先于workAvailable. 【注意】VX_MEM_BARRIER_W()并不是强迫将变量写入内存,而是指定了写的顺序 【注意】VX_MEM_BA
42、RRIER_W()必须与VX_MEM_BARRIER_R()一起使用。 (3) 读写(满)Memory Barrier VX_MEM_BARRIER_RW()宏定义提供读/写(满)memory barrier。VX_MEM_BARRIER_RW()包括了VX_MEM_BARRIER_R()和VX_MEM_BARRIER_W()的功能。使用VX_MEM_BARRIER_RW()的代价要高于VX_MEM_BARRIER_R()或VX_MEM_BARRIER_W()的使用代价。Wind River不推荐使用VX_MEM_BARRIER_RW()。 10. 原子的内存操作(原子操作)
43、 原子操作是利用了CPU支持原子访问内存的特点。原子操作是一些不能被中断的操作的集合。原子操作为一组操作提供了互斥性(例如变量的自增、自减操作)。 使用原子操作更新一个数据,可以省去使用锁的步骤。例如,你想更新一个链表元素的next指针从NULL到非NULL,当你使用原子操作时,这个过程就不用使用中断锁了,这样可以使算法变得简单。 在调用者使用原子操作的时候,必须保证该操作所在的内存是可以访问的。若访问了一个不可访问的内存,会产生一个异常。 在vxAtmicLib库中提供了许多原子操作。如表7所示。需要注意的是vxAtmicLib还提供了这些原子操作的inline版本。例如,vxAto
44、micAdd_inline()。还提供了兼容SMP和AMP的版本。例如vxAtomic32Add()。原子操作可以在用户(RTP APP)、内核空间中使用。 表 7 原子操作API API 描述 atomicVal_t vxAtomicAdd( atomic_t * target, /* memory location to add to */ atomicVal_t value /* value to add */ ) 将两个值相加。 atomicVal_t vxAtomicSub( atomic_t * target, /* memory l
45、ocation to subtract from */ atomicVal_t value /* value to sub */ ) 将两个值相减 atomicVal_t vxAtomicInc( atomic_t * target /* memory location to increment */ ) 将值增加1 atomicVal_t vxAtomicDec( atomic_t * target /* memory location to decrement */ ) 将值减1 atomicVal_t vxAtomicOr(
46、 atomic_t * target, /* memory location to OR */ atomicVal_t value /* OR with this value */ ) 将两个值进行位或操作 atomicVal_t vxAtomicXor ( atomic_t * target, /* memory location to XOR */ atomicVal_t value /* XOR with this value */ ) 将两个值进行位异或操作 atomicVal_t vxAtomicAnd ( atomic_t *
47、 target, /* memory location to AND */ atomicVal_t value /* AND with this value */ ) 将两个值进行位与操作, atomicVal_t vxAtomicNand ( atomic_t * target, /* memory location to NAND */ atomicVal_t value /* NAND with this value */ ) 将两个值进行位非与操作 atomicVal_t vxAtomicSet ( atomic_t * target
48、 /* memory location to set */ atomicVal_t value /* set with this value */ ) 将一个值设定为另一个值 atomicVal_t vxAtomicClear( atomic_t * target /* memory location to clear */ ) 将一个值清空 BOOL vxCas( atomic_t * target, /* memory location to compare-and-swap */ atomicVal_t oldValue, /* c
49、ompare to this value */ atomicVal_t newValue /* swap with this value */ ) 对比或交换内存中的值。 11. CPU Affinity VxWorks SMP提供了CPU Affinity这种机制。通过这种机制可以将中断或者任务分配给指定的CPU执行。 (1) 任务级 CPU Affinity VxWorks SMP具有将任务分配给指定CPU执行的能力。从另一个角度来说,即将指定CPU预留给指定任务。 SMP的默认操作——任何任务可以运行在任何CPU上——这会根据系统的整体性能而定。但是有些时
50、候将指定任务分配给指定的CPU对系统性能是有帮助的。例如一个CPU上只运行一个单独的任务而不做其他事情,则这块CPU的cache中就只保存了这个任务所需要的数据和代码。这样做节省了任务在CPU之间切换的消耗。 还有个例子就是当多个任务争夺一个spinlock时,如果这些任务运行在不同的CPU上,则会有大量的时间被浪费在等待spinlock上。若将争夺同一个spinlock的任务指定在同一个CPU上运行,则这会给另一块CPU上执行其他程序带来便利。 关于任务级 CPU affinity的使用方法如下: a. 一个任务可以通过调用taskCpuAffinitySet()设置自己的CPU af






