优质博文:IT-BLOG-CN
一、简介
为什么需要happens-before
原则: 主要是因为Java内存模型 , 为了提高CPU
效率,通过工作内存Cache
代替了主内存。修改这个临界资源会更新work memory
但并不一定立刻刷到主存中。通常JMM
会将编写的代码编译后执行,在编译器中生成的指令的顺序跟源码的顺序并不是完全一致的。处理器可能采用乱序或者并行的方式来执行指令,因为在JVM
中只要程序的最终结果一致,这种重排序是允许的。并且处理器还有本地缓存,当将结果存储在本地缓存中,其他线程是无法看到结果的。除此之外缓存提交到主内存的顺序也肯能会变化。在多线程环境下可能会产生不同的结果。针对以上两个问题,JMM
给出happens-before
通用的规则。
为了保证java
内存模型中的操作顺序,JMM
为程序中的所有操作定义了一个顺序关系,这个顺序叫做Happens-Before
。要想保证操作B
看到操作A
的结果,不管A
和B
是在同一线程还是不同线程,那么A
和B
必须满足Happens-Before
的关系。如果两个操作不满足happens-before
的关系,那么JVM
可以对他们任意重排序。
两个操作间具有happens-before
关系,并不意味着前一个操作必须要在后一个操作之前执行。happens-before
仅仅要求前一个操作对后一个操作可见。
volatile 就是一个践行happens-before
的关键字。happens-before
指的是线程接收其他线程修改共享变量的消息与该线程读取共享变量的先后关系。volatile
变量规则:对一个volatile
的写,happens-before
于任意后续对这个volatile
变量的读。
从Java
源代码到最终实际执行的指令序列,会分别经历下面3种重排序:源代码 —— 编译器优化重排 —— 指令级并行的重排序 —— 内存系统的重排序 —— 最终执行的指令序列
【1】编译器优化的重排序。编译器在不改变单线程程序语义的前提下,可以重新安排语句的执行顺序。
【2】指令级并行的重排序。现代处理器采用了指令级并行技术来将多条指令重叠执行。如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序。
【3】内存系统的重排序。由于处理器使用缓存和读/写缓冲区,这使得加载和存储操作看上去可能是在乱序执行。
二、happens-before的规则
【1】程序顺序规则: 如果在程序中操作A
在操作B
之前,那么在同一个线程中操作A
将会在操作B
之前执行。这里的操作A
在操作B
之前执行是指在单线程环境中,虽然虚拟机会对相应的指令进行重排序,但是最终的执行结果跟按照代码顺序执行是一样的。虚拟机只会对不存在依赖的代码进行重排序。
【2】监视器锁规则: 监视器上的解锁操作必须在同一个监视器上面的加锁操作之前执行。如果线程1解锁了monitor a
,接着线程2锁定了a
,那么,线程1解锁a
之前的写操作都对线程2可见(线程1和线程2可以是同一个线程)
【3】volatile变量规则: 对volatile
变量的写入操作必须在对该变量的读操作之前执行。原子变量和volatile
变量在读写操作上面有着相同的语义。如果线程1写入了volatile
变量v
(临界资源),接着线程2读取了v
,那么,线程1写入v及之前的写操作都对线程2可见
【4】线程启动规则: 线程上对Thread.start
的操作必须要在该线程中执行任何操作之前执行。假定线程A
在执行过程中,通过执行ThreadB.start()
来启动线程B
,那么线程A
对共享变量的修改在接下来线程B
开始执行前对线程B可见。注意:线程B
启动之后,线程A
在对变量修改线程B
未必可见。
【5】线程结束规则: 线程中的任何操作都必须在其他线程检测到该线程结束之前执行。线程t1写入的所有变量,在任意其它线程t2调用t1.join()
,或者t1.isAlive()
成功返回后,都对t2
可见。
【6】中断规则: 当一个线程再另一个线程上调用interrupt
时,必须在被中断线程检测到interrupt
调用之前执行。
【7】终结器规则: 对象的构造函数必须在启动该对象的终结器之前执行完毕。对象调用finalize()
方法时,对象初始化完成的任意操作,同步到全部主存同步到全部cache
。
【8】传递性: 如果操作A
在操作B
之前执行,并且操作B
在操作C
之前执行,那么操作A
必须在操作C
之前执行。
案例: 单例模式
public class Flight { private static Flight flight; public static Flight getFlight(){ if(flight == null) { flight = new Flight(); } return flight; }}
上面的类中定义了一个getFlight
方法来返回一个新的Flight
对象,返回对象之前,我们先判断了flight
是否为空,如果不为空的话就new
一个Flight
对象。但是如果考虑到JMM
的重排规则,就会发现问题。flight = new Flight()
其实一个复杂的命令,并不是原子性操作。它大概可以分解为**1.分配内存,2.实例化对象,3.将对象和内存地址建立关联。**其中2和3有可能会被重排序,然后就有可能出现book
返回了,但是还没有初始化完毕的情况。从而出现不可以预见的错误。根据上面的happens-before
规则,最简单的办法就是给方法前面加上synchronized
关键字:
public class Flight { private volatile static Flight flight; public static Flight getFlight(){ if(flight == null ){ synchronized (Flight.class){ if(flight == null) { flight = new Flight(); } } } return flight; }}
上面的类中检测了两次Flight
的值,只有flight
为空的时候才进行加锁操作。这里flight
一定要是volatile
。因为flight
的赋值操作和返回操作并没有happens-before
,所以可能会出现获取到一个仅部分构造的实例。这也是为什么我们要加上volatile
关键词。
三、as-if-serial语义
as-if-serial
语义: 不管怎么重排序,单线程程序的执行结果不能被改变。编译器、runtime
和处理器都必须遵守as-if-serial
语义。所以编译器和处理器不会对存在数据依赖关系的操作做重排序,因为这种重排序会改变执行结果。但是,如果操作之间不存在数据依赖关系,这些操作就可能被编译器和处理器重排序。
::: warning
在单线程程序中,对存在控制依赖的操作重排序,不会改变执行结果。
在多线程程序中,对存在控制依赖的操作重排序,可能会改变程序的执行结果。
:::
本质上来说Happens-before
关系和as-if-serial
语义是一回事,都是为了在不改变程序执行结果的前提下,尽可能地提高程序执行的并行度。只不过后者只能作用在单线程,而前者可以作用在正确同步的多线程环境下:as-if-serial
语义保证单线程内程序的执行结果不被改变,Happens-before
关系保证正确同步的多线程程序的执行结果不被改变。as-if-serial
语义给编写单线程程序的程序员创造了一个幻境:单线程程序是按程序的顺序来执行的。Happens-before
关系给编写正确同步的多线程程序的程序员创造了一个幻境:正确同步的多线程程序是按Happens-before
指定的顺序来执行的。
四、案例
class VolitileExample { int a = 0; volatile boolean flag = false; public void reader() { if (flag == true) { int i = a; } } public void writer() { a = 10; flag = true; }}
假设Thread A
执行writer()
方法之后,Thread B
执行reader()
方法。根据根据程序次序规则:1 Happens-before 2
;3 Happens-before 4
。根据volatile
变量规则:2 Happens-before 3
。根据传递性规则:1 Happens-before 3
;1 Happens-before 4
。也就是说,如果Thread B
读到了flag==true
或者int i = a
那么Thread A
设置的a=42
对Thread B
是可见的。