理论基础
# 0.理论基础
# 前言
# 常见的线程调度模型
抢占式调度模型
抢占式调度指的是每条线程执行的时间、线程的切换都由系统控制,系统控制指的是在系统某种运行机制下,可能每条线程都分同样的执行时间片,也可能是某些线程执行的时间片较长,甚至某些线程得不到执行的时间片。在这种机制下,一个线程的堵塞不会导致整个进程堵塞。
协同式调度
协同式调度指某一线程执行完后主动通知系统切换到另一线程上执行,这种模式就像接力赛一样,一个人跑完自己的路程就把接力棒交接给下一个人,下个人继续往下跑。线程的执行时间由线程本身控制,线程切换可以预知,不存在多线程同步问题,但它有一个致命弱点:如果一个线程编写有问题,运行到一半就一直堵塞,那么可能导致整个系统崩溃
Java 使用的线程调使用抢占式调度
Java 中线程会按优先级分配 CPU 时间片运行,且优先级越高越优先执行,但优先级高并不代表能独自占用执行时间片,可能是优先级高得到越多的执行时间片 ,反之,优先级低的分到的执行时间少但不会分配不到执行时间。
线程让出 cpu 的情况:
当前运行线程主动放弃 CPU,JVM 暂时放弃 CPU 操作(基于时间片轮转调度的 JVM 操作系统不会让线程永久放弃 CPU,或者说放弃本次时间片的执行权),例如调用 yield()方法。
当前运行线程因为某些原因进入阻塞状态,例如阻塞在 I/O 上。
当前运行线程结束,即运行完 run()方法里面的任务。
其中和线程调度有关的函数方法:
实例方法
void setPriority(int newPriority) 设置线程的优先级
int getPriority() 获取线程优先级
最低优先级1
默认优先级是5
最高优先级10
优先级比较高的获取CPU时间片可能会多一些。(但也不完全是,大概率是多的。)void join()
// 合并线程 class MyThread1 extends Thread { public void doSome(){ MyThread2 t = new MyThread2(); t.join(); // 当前线程进入阻塞,t线程执行,直到t线程结束。当前线程才可以继续。 } } class MyThread2 extends Thread{ }
1
2
3
4
5
6
7
8
9静态方法
static void yield() 让位方法
暂停当前正在执行的线程对象,并执行其他线程
yield()方法不是阻塞方法。让当前线程让位,让给其它线程使用。
yield()方法的执行会让当前线程从“运行状态”回到“就绪状态”。
注意:在回到就绪之后,有可能还会再次抢到。
# 为什么需要多线程
众所周知,CPU、内存、I/O设备的速度有极大的差异,为了合理利用CPU的高性能,平衡这三者的速度差异,计算机体系结构、操作系统、编译程序都做出了贡献。
# Java三大变量中的线程安全问题
实例变量:在堆中。
静态变量:在方法区。
局部变量:在栈中。
以上三大变量中:
局部变量永远都不会存在线程安全问题。 因为局部变量不共享。(一个线程一个栈。)
堆和方法区都是多线程共享的,所以可能存在线程安全问题。
# 并发出现问题的根源:并发三要素
可见性:CPU缓存引起
- 当线程A对共享变量进行修改时,会先把这个修改的值加载到高速缓存中,并不会马上写入到主存里边,这样线程B访问这个共享变量的时候就无法立即看到线程A修改的数据,这就是可见性问题
原子性:分时复用引起
- 即一个操作或者多个操作要么全部执行并且执行的过程不被如何因素打断,要么就都不执行,比如说经典的转账问题
有序性:重排序引起
- 即程序不一定会按照代码的先后顺序执行,因为在JVM层面可能会进行指令重排序,比如说:编译器优化重排序、指令级重排序、内存重排序。这些重排序都有可能导致多线程查询产生内存可见性问题。
# 线程安全的实现方法
# 1、 互斥同步
也就是加锁,例如synchronize和ReentrantLock
互斥同步最主要的问题是线程阻塞和唤醒所带来的性能问题,因此也叫阻塞同步。
# 2、非阻塞同步
比较常见的有CAS:Compare-and-Swap,就是先进行操作,如果没有其他线程争用共享数据,那就操作成功了,否则采取补偿措施,不断的重试直到成功为止。也就是硬件所支持原子性操作:比较并交换。需要注意的是ABA问题
# 3、无同步方案
也就是避免线程共享数据:主要有使用局部变量、ThreadLocal、或者MQ生产者消费者这种模式(一个请求对应一个线程,使用线程本地存储)来避免线程安全问题
# 说到线程同步这块,涉及到这两个专业术语
异步编程模型:
线程t1和线程t2,各自执行各自的,t1不管t2,t2不管t1,谁也不需要等谁,这种编程模型叫做:异步编程模型。
其实就是:多线程并发(效率较高)
同步编程模型:
线程t1和线程t2,在线程t1执行的时候,必须等待t2线程执行结束,或者说在t2线程执行的时候,必须等待t1线程执行结束,两个线程之间发生了等待关系,这就是同步编程模型。 效率较低。线程排队执行。
# CAS(Compare And Swap/Set)
概念及特性
比较并交换,实现方式是基于硬件平台的汇编指令,就是说CAS是靠硬件实现的。
CAS 算法的过程是这样:它包含 3 个参数CAS(V,E,N)。V 表示要更新的变量(内存值),E 表示预期值(旧的),N 表示新值。当且仅当 V 值等于 E 值时,才会将 V 的值设为 N,如果 V 值和 E 值不同,则说明已经有其他线程做了更新,则当前线程什么都不做。最后,CAS 返回当前 V 的真实值。 CAS 操作是抱着乐观的态度进行的(乐观锁),它总是认为自己可以成功完成操作。当多个线程同时使用 CAS 操作一个变量时,只有一个会胜出,并成功更新,其余均会失败。失败的线程不会被挂起,仅是被告知失败,并且允许再次尝试,当然也允许失败的线程放弃操作。 基于这样的原理,CAS 操作即使没有锁,也可以发现其他线程对当前线程的干扰,并进行恰当的处理。
ABA 问题
CAS 会导致“ABA 问题”。CAS 算法实现一个重要前提需要取出内存中某时刻的数据,而在下时刻比较并替换,那么在这个时间差类会导致数据的变化。 比如说一个线程 one 从内存位置 V 中取出 A,这时候另一个线程 two 也从内存中取出 A,并且two 进行了一些操作变成了 B,然后 two 又将 V 位置的数据变成 A,这时候线程 one 进行 CAS 操作发现内存中仍然是 A,然后 one 操作成功。尽管线程 one 的 CAS 操作成功,但是不代表这个过程就是没有问题的。
部分乐观锁的实现是通过版本号(version)的方式来解决 ABA 问题,乐观锁每次在执行数据的修改操作时,都会带上一个版本号,一旦版本号和数据的版本号一致就可以执行修改操作并对版本号执行+1 操作,否则就执行失败。因为每次操作的版本号都会随之增加,所以不会出现 ABA 问题,因为版本号只会增加不会减少。