Java中的多线程安全问题

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

一、什么是线程安全

二、线程不安全的原因

2.1 从底层剖析count++的操作

2.2 线程不安全的原因总结

2.3 JVM内存模型JMM

三、synchronized 关键字-监视器锁monitor lock

3.1 如何加锁Synchronized用法和特性

5.1 volatile可以保证内存可见性

5.2 volatile不可以保证原子性

一、什么是线程安全

简单的理解如果多线程环境下代码运行的结果是符合我们预期的即在单线程环境应该的结果则说这个程序是线程安全的。

观察一下代码使用两个线程每个线程都对这个 Counter进行5w次自增预计是结果为10w。

/**
 * Created with IntelliJ IDEA.
 * Description:
 * User: 86136
 * Date: 2023-01-12
 * Time: 20:50
 */
class Counter {
    public int count = 0;

    public void increase() {
        count++;
    }
}
public class Demo13 {
    static Counter counter = new Counter();
    public static void main(String[] args) throws InterruptedException {
        //使用两个线程每个线程都对这个 Counter进行5w次自增
        //预计是结果为10w

        Thread t1 = new Thread(() -> {
            for (int i = 0; i < 5_0000; i++) {
                counter.increase();
            }
        });
        Thread t2 = new Thread(() -> {
            for (int i = 0; i < 5_0000; i++) {
                counter.increase();
            }
        });
        t1.start();
        t2.start();
        t1.join();
        t2.join();
        System.out.println(counter.count);
    }
}

运行结果

二、线程不安全的原因

上面我们使用了多线程运行了一个程序想让这个变量从0自增到10w次但是最终实际结果比我们预期的结果要小这是线程调度顺序的随机性导致的造成了线程间自增的指令集交叉导致本来需要自增两次但值只自增了一次的情况。所以得到的结果偏小。

2.1 从底层剖析count++的操作

count++ 操作在底层其实是被分为三条指令在CPU上进行执行的

把内存的数据读取到CPU的寄存器上load)
把CPU的寄存器中的值进行+1add
把寄存器中的值写回到内存中save

这里简单的描述几种情况初始条件初始值为1对其进行两次自增。

🚩情况1 线程间的指令集没有交叉运行结果和预期结果相同

🚩情况2线程间指令集存在交叉运行结果低于预期结果

🚩情况3线程间的指令集完全交叉实际结果低于预期。

根据上面我们所举出的情况可以得出满足线程安全需要具备原子性自增操作的三条指令可以拆分不具备这个特点。

2.2 线程不安全的原因总结

抢占式执行可以说是线程不安全的万恶之源多个线程的调度执行过程是“完全随机的‘这里并非是数学上的完全随机但是确实是没有规律可言。
多个线程修改同一个变量。
修改操作不是原子的如count++一样其本质在CPU上其实会被分为loadaddsave这三个单位。解决线程安全最常见的手段就是从这里入手通过一些方法将这些指令打包为一个整体。
内存可见性问题这是JVM的代码优化背景下在运用到多线程中引入的bug。
指令重排序可以理解为规划最优路线这是一种编译器优化举个栗子洗碗烧水和拖地我们可以在洗碗的时候同时进行烧水的工作。

对于指令重排序的前提是 "保持逻辑不发生变化". 这一点在单线程环境下比较容易判断, 但是在多线程环境下就没那么容易了, 多线程的代码执行复杂程度更高, 编译器很难在编译阶段对代码的执行效果进行预测, 因此激进的重排序很容易导致优化后的逻辑和之前不等价

现在我们对以上的 内存可见性 进行一定的补充

可见性的定义

一个线程对共享变量值的修改能够及时地被其他线程看见。

2.3 JVM内存模型JMM

Java虚拟机规范中定义了Java内存模型目的是屏蔽掉各种硬件和操作系统的内存访问差异以实现让Java程序在各种平台下都能达到一致的并发效果。

线程之间的共享变量存在主内存中Main Memory
每一个线程都有自己的“工作内存”Work Memory
当线程要读取一个共享变量的时候会先把变量从主内存拷贝到工作内存中再从工作内存读取数据。
当线程要修改一个共享变量的时候也会先把工作内存中的副本再同步到主内存中。

但是由于每个线程都有自己的工作内存这些工作内存中的内容相当于同一个共享变量的副本此时如果修改线程1的工作内存的值线程2的工作内存不一定会及时变化。

犹如下面情况

🚩初始情况当两个线程的工作内存相同时候。

🚩后续一旦线程1修改了a的值那么主内存不一定能够及时同步对应的线程2的工作内存的a值也不一定能及时同步。

这时的代码可能就会出现问题。

思考为什么需要那么多内存为什么要这么麻烦的拷贝来拷贝去

1实际并没有那么多的内存这只是Java规范中的一个术语是属于抽象的叫法,因为我们需要更好的通用性/跨平台性,Java语言的初衷其实就是让程序员们感受不到硬件上的差异。比如工作内存就和硬件无关因为CPU内部的结构是不一样的有的CPU是只带寄存器有的带寄存器和缓存有的CPU缓存还有多级缓存L1,L2,L3.这时不同CPU存储方式就不一样了此时使用工作内存就代指上面一套寄存器+缓存。

所谓的 “主内存”才是真正硬件角度的内存而所谓的 “工作内存”则是指CPU的寄存器和高速缓存。

2因为CPU访问自身寄存器的速度以及高速缓存的速度远超于访问内存的速度快了3-4个数量级。

比如某个代码要连续10次读取某个变量的值如果10次都从内存读速度是很慢的但是如果只是第一次从内存读读到的结果缓存到CPU的某个寄存器中那么后9次读数据就不必访问内存了效率大大提高。

那么问题来了既然访问寄存器的速度这么快那么全部都用寄存器不就好了为什么还需要内存呢?

因为CPU中的寄存器价格昂贵内存次之硬盘最便宜。所以导致了需要内存配合寄存器使用。

值得一提的是快和慢是相对的CPU访问寄存器的速度远远高于访问内存的速度但是内存的访问速度又远远快于硬盘。

这里用一段代码再次演示以便加深印象

我们已经知道访问寄存器的速度是远远高于内存的在下面这段代码中while循环内会频繁的进行读内存LOAD和比较的操作CMP比较寄存器中的值是否为0.

由于load消耗的时间比CMP的时间慢了3~4个数量级于是编译器就会对这一现象进行优化

编译器认为因为要频繁的执行load而且load得到的结果是一样的编译器这么认为的实际不一定比如下面我们举的例子。于是就只执行一次load后续在进行CMP的时候就不会再读内存了而是读JMM中的工作内存寄存器的值或者缓存。

但是如果在这期间有人修改了这个值代码就会因为编译器的优化而出现bug

结论编译器优化会在多线程的情况下可能会出现误判。

既然编译如果在自己判断不准确的话把不该优化的地方优化了那么就可以让程序员们显示的提醒编译器该地方无需优化。这也正是volatile的作用。

三、synchronized 关键字-监视器锁monitor lock

那么以上的问题如何解决呢那就需要引入Java中的”锁”

再回顾刚刚的代码我们只需要将increase方法用synchronized修饰即可。

class Counter {
    public int count = 0;

    public synchronized void increase() {
        count++;
    }
}

整段代码


class Counter {
    public int count = 0;

    public synchronized void increase() {
        count++;
    }
}
public class Demo13 {
    static Counter counter = new Counter();
    public static void main(String[] args) throws InterruptedException {
        //使用两个线程每个线程都对这个 Counter进行5w次自增
        //预计是结果为10w

        Thread t1 = new Thread(() -> {
            for (int i = 0; i < 5_0000; i++) {
                counter.increase();
            }
        });
        Thread t2 = new Thread(() -> {
            for (int i = 0; i < 5_0000; i++) {
                counter.increase();
            }
        });
        t1.start();
        t2.start();
        t1.join();
        t2.join();
        System.out.println(counter.count);
    }
}

运行结果

3.1 如何加锁Synchronized用法和特性

3.1.1. 独占性

利用synchronized的独占性也称互斥性通俗一点来说就是如果当前锁没有被上锁那么这个加锁操作就会成功如果当前锁已经被人加上加锁操作就会阻塞等待。

进入 synchronized 修饰的代码块相当于加锁
退出 synchronized 修饰的代码块相当于解锁

加锁之后原先可以交叉执行的指令就无法交叉变成了一个整体。

如果仍无法理解线程1在参与其他工作时候线程2无法进入CPU执行可以看一下这个栗子

类似于图书馆占座小A同学占座之后不一定每时每刻都在图书馆位子上可能中途上厕所饭点去吃饭之类的而这期间小B同学想使用小A的这个位置是不被允许的。

如果把for也写到加锁代码里这时候就跟完全串行一样了。

总结加锁要考虑好锁哪段代码锁的代码范围不一样对代码执行效果会有很大影响锁的代码越多就叫做”锁的粒度越大/越粗“,锁的代码越少就叫做”锁的粒度越小/越细“。

有的同学可能会问如果一个线程加锁一个线程不加锁这时线程安全能否保证

首先我们要明白一点线程安全不是因为加了锁就一定安全而是通过加锁让并发修改同一个变量变成串行修改同一个变量才安全。结论就是不正确的加锁方式不一定能解决线程安全问题。

举例这时只给一个线程加锁这个是没啥用的一个线程加锁不涉及到”锁竞争“也就不会阻塞等待相应也就不会并发执行变成串行执行。


class Counter {
    public int count = 0;

    public synchronized void increase() {
        count++;
    }
    public  void increase2() {
        count++;
    }

}
public class Demo13 {
    static Counter counter = new Counter();
    public static void main(String[] args) throws InterruptedException {
        //使用两个线程每个线程都对这个 Counter进行5w次自增
        //预计是结果为10w

        Thread t1 = new Thread(() -> {
            for (int i = 0; i < 5_0000; i++) {
                counter.increase();
            }
        });
        Thread t2 = new Thread(() -> {
            for (int i = 0; i < 5_0000; i++) {
                counter.increase2();
            }
        });
        t1.start();
        t2.start();
        t1.join();
        t2.join();
        System.out.println(counter.count);
    }
}

运行结果仍比期望的10w小

在日常开发的过程中可能会碰到需要加锁的代码不完全都在一个方法中这时该怎么处理

其实我们的synchronized除了能修饰方法外还可以修饰代码块。因此我们就可以把要进行加锁的逻辑放到synchronized修饰的代码块中也能起到加锁的效果。

写法1

需要注意的是synchronized里面锁的对象个数只能为一虽然在Java中任何对象都可以被当作锁对象但是我们并不关心对象是谁而是关系是否锁的是同一个对象因为只有多个线程锁同一个对象的时候这时才能进行锁竞争。

就如下图一样因为是针对两个不同对象进行加锁所以不涉及到锁竞争。

写法2针对locker对象进行加锁locker是Counter的一个普通成员非静态成员每一个Counter实例中都有自己的locker实例。

分析这个代码中都针对counter对象进行加锁counter对象中的locker是同一个对象因此仍然可以导致锁竞争的产生。

延申1如果这里调用count1count2的increase因为locker不是同一个locker结论

同样无法产生锁竞争。

延申2将locker变为静态的。结论;会产生锁竞争。

延申3一个锁locker一个锁当前对象this结论不会产生锁竞争

延申4锁对象为一个类对象 Counter.class在JVM中只有一个存储的是Counter中的详细信息比如属性数量名称类型等,结论会产生锁竞争。

延申5synchronized修饰静态方法结论会产生锁竞争。

synchronized用法总结

1.修饰普通方法锁对象相当于this。

2.修饰代码块锁对象需要在内指定。

3.修饰静态方法锁对象相当于类对象注意这里并不是锁整个类。

3.1.2 可重入性

synchronized 是可以对同一条线程是可重入的不会出现自己把自己锁死的情况。

何为死锁

简单来说就是一个线程针对一把锁加锁两次。

第一次加锁可以成功第二次加锁就会失败

分析因为第二次加锁的时候锁已经被占用要想加锁成功必须等待第一把锁解锁但是第一把锁要想执行完成必须执行完第二把加锁的代码块。这造成死循环。

针对上述情况不会产生死锁的情况就叫做”可重入锁“ 会产生死锁的情况就叫做”不可重入锁“。

当然我们这里所讲到的 synchronized是可重入锁。

可重入锁的底层实现

其实道理是很简单的。原则1 就是让这个锁记录好是哪个线程持有这把锁即可。

比如线程t尝试对针对this进行加锁this这个锁就记录t持有了它自己当第二次t进行加锁的时候锁一看还是t线程于是就直接放行通过。这是不需要阻塞等待的。

原则2就是内部维护一个计数器用来衡量什么时候是真加锁什么时候需要解锁什么时候需要直接放行。这些synchronized会帮我们维护好不需要我们关心。

ps加锁代码中出现了一次是不会出现死锁的情况的无论如何代码都能执行到。这也是synchronized被设计为关键字的一个原因。

四、Java 标准库中的线程安全类

Java标准库中很多都是线程不安全的这些类可能会设计到多线程修改共享数据但是没有任何自带的加锁措施

ArrayList
LinkedList
HashMap
TreeMap
HashSet
TreeSet
StringBuilder

但是还有一些是线程安全的. 使用了一些锁机制来控制.

Vector (不推荐使用)
HashTable (不推荐使用)
ConcurrentHashMap
StringBuffer

StringBuffer 的核心方法都带有 synchronized .

还有的虽然没有加锁, 但是不涉及 "修改", 仍然是线程安全的

String

五、volatile关键字

5.1 volatile可以保证内存可见性

我们上面提到了volatile所修饰的变量能够保证”内存可见性“。

再次引用上面我们在JMM中提到的例子

import java.util.Scanner;

class Counter {
    public static volatile int count = 0;
    static Object locker = new Object();
    public  void increase() {
        synchronized(Counter.class) {
            count++;
        }
    }
    public void increase2() {
        synchronized (this) {
            count++;
        }
    }
    public  synchronized void increase3() {
        synchronized (this) {
            //.....
        }
    }
}

public class Demo13 {
    static Counter counter = new Counter();
    static Counter counter2 = new Counter();
    public static void main(String[] args) throws InterruptedException {
        Thread t1 = new Thread(() -> {
            while(Counter.count == 0 ) {

            }
            System.out.println("t1线程执行结束");
        });
        Thread t2 = new Thread(() -> {
            System.out.println("请输入一个int");
            Scanner scanner = new Scanner(System.in);
            Counter.count = scanner.nextInt();
        });
        t1.start();
        t2.start();
        t1.join();
        t2.join();
//        System.out.println(counter.count);
//        System.out.println(counter2.count);
    }
}

运行结果

分析这里给count变量加上了volatile强制读取了内存禁止了编译器的优化避免了直接读取CPU寄存器中缓存的数据而是每次都重新读取内存速度是变慢了但是准确度提高了。

5.2 volatile不可以保证原子性

volatile和synchronized有着本质的区别synchronized能够保证原子性volatile保证的是内存可见性。

这里我们把上面count++的例子利用两个线程将count从0自增到10w次

static class Counter {
    volatile public int count = 0;
    void increase() {
        count++;
    }
}
public static void main(String[] args) throws InterruptedException {
        final Counter counter = new Counter();
        Thread t1 = new Thread(() -> {
            for (int i = 0; i < 50000; i++) {
                counter.increase();
            }
        });
        Thread t2 = new Thread(() -> {
            for (int i = 0; i < 50000; i++) {
                counter.increase();
            }
        });
        t1.start();
        t2.start();
        t1.join();
        t2.join();
        System.out.println(counter.count);
}

结论可以看出由于volatile无法保证原子性所以再涉及到count++这类操作在底层会把自增操作拆分为三个指令时无法保证线程安全。