简单聊聊线程安全

起因

sonar 是一个代码质量管理工具,某天它揭露了代码里这样一个级别为严重的违规

SimpleDateFormat 源码解析

根据 sonar 的提示,SimpleDateFormat 的 format 方法可能存在线程安全的问题,那么来看下SimpleDateFormat 的源码,看看是否如此

当看到第 5 行代码时,就基本可以认定SimpleDateFormat.format()不是线程安全的:在多线程环境下,每次调用 format 方法时,calendar 都会将时间设置为传入的时间,这样如果上一个线程的 format 方法还在执行中,肯定会导致输出的结果不正确

如何做到线程安全

那么怎么做才能线程安全呢?

不用静态属性

每次需要格式化日期时,new 一个 DateFormat,保证线程安全,我们可以这样“优化”一下

虽然线程安全了,但是这样性能就下降了,如果这段代码频繁的调用,不仅 new 一个 DateFormat 对象的代价有点大,而且频繁的 new 也会导致 gc 的压力增大

同步或者加锁

既然format()方法线程不安全,那就在调用时采用同步或加锁,例如

DateFormat 池

加锁是解决了线程安全的问题,也不会因为 new 出太多的 DateFormat 增加 gc 的负担,但是很显然并发性能大大的降低了,如果在并发性要求较高的场合,还不如 new 一个的性能高呢,那有什么办法再优化一下吗

可以实现一个 DateFormat 池,实现如下功能

  • 设定池的大小,在池实例化的同时,实例化一批 DateFormat

  • 每个 DateFormat 都有一个状态,表明当前是空闲还是忙,初始状态为空闲

  • 当需要格式化日期时,从池里取出一个空闲的 DateFormat,同时将其标记为忙

  • 池里的 DateFormat 的 format 方法需要重写,在 format 完成后将其状态标记为空闲

用池的优势很明显:只要设定合适的池大小,就不用担心并发性能;并且也不存在增加 gc 负担的问题;当然池的实现比较复杂,而且池内部也要解决线程安全问题,可以考虑采用一些开源的池框架例如 Apache commons pool 来做

ThreadLocal<DateFormat>

在引入 ThreadLocal 之前,思考一下这个问题:如果只有一个线程,format方法还存在线程安全问题吗?

显然不会,如果只有一个线程,则format方法实际上是串行执行的,绝无可能并行执行;那么,如果在多线程环境下,给每个线程都分配一个固定的 DateFormat 来执行format方法,显然也不会有线程安全的问题了

ThreadLocal 就是用于这种思路的一个解决方案:为每个使用该变量的线程提供独立的变量副本,所以每一个线程都可以独立地改变自己的副本,而不会影响其它线程所对应的副本。

ThreadLocal 的使用如下

如何选择

先看每次都 new 一个新对象和 ThreaLocal之间的差别,假设有 1 个线程要执行 n 次 format

  • new:n 个实例

  • ThreadLocal:1 个实例

但是,如果是 n 个线程,每个线程只执行 1 次 format 呢?

  • new:n 个实例

  • ThreadLocal:n 个实例

很显然,如果使用 ThreadLocal 的话,线程应该是能复用的,否则和 new 的效果是一样滴

再看加锁和池的差别,主要表现在并发性能方面,加锁实际导致了串行化,不满足高并发的场合

再看下池和 ThreadLocal 的差别

  • 并发性能上 2 者都很优秀

  • 相对来说 ThreadLocal 的实现更简单,而且完全不需要加锁或同步,而池在管理池内的元素时免不了需要加锁或同步

  • 池的复用性最好,而 ThreadLocal 的复用性则完全取决于其宿主线程的复用性

Last updated